网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于GCN⁃LSTM组合模型的基坑钢支撑轴力时空序列预测  PDF

  • 秦世伟
  • 朱则匀
  • 戴自立
上海大学力学与工程科学学院,上海 200444

中图分类号: TU17

最近更新:2025-01-13

DOI:10.13409/j.cnki.jdpme.20231208001

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

基坑钢支撑的轴力变化是反应基坑中内力变化的重要指标,也是基坑工程灾害防治的重点研究对象。由于土体力学性质的复杂性以及受力演化的不确定性,单纯通过监测和计算难以把握基坑中实际的内力变化趋势。已有研究表明支撑轴力的演化具有典型的时序特征,可使用时间序列预测模型对数据进行预测分析,但预测精度普遍不高。基坑中多个点位的支撑轴力变化往往具有明显的空间相关性,但现有的模型无法捕捉空间信息。为解决上述问题,使用图卷积神经网络(Graph Convolutional Neural Network, GCN)和长短期记忆网络(Long Short⁃Term Memory, LSTM),组合构建了能捕捉数据时间和空间特征的时空序列预测模型。该模型根据实际点位的空间信息构建了邻接矩阵并生成对应的空间特征,以支撑轴力,空间信息,温度作为输入特征,来预测支撑轴力的发展趋势。使用上海某车站项目中四个具有空间相关性的点位数据进行预测分析,并将组合模型的预测结果与实测数据、单一LSTM模型预测数据进行对比,结果表明:(1)组合模型的收敛速度更快,对于长周期的数据拟合能力更强,并且能更好的反应数据的波动性;(2)组合模型的精度高于仅考虑时间序列特征的单一LSTM模型,有效提高了支撑轴力数据的预测精度。该模型可为实际工程数值预测提供计算参考。

0 引 言

随着社会的快速发展,深基坑工程项目逐渐增多,基坑工程的安全问题成了关注重点。基坑开挖卸荷会引起坑内外土压力的失衡,而支护结构尤其是支撑将起到抵抗外侧土压力保护基坑的作用,其设计支撑所起的作用即支撑轴力需要重点监测。由于土体力学性质的复杂性以及受力演化的不确定性,实际的监测数据可能会和设计计算的不一致,单纯的监测难以把握基坑支撑轴力的发展规律。而工程支护结构一旦受损,可能导致地下工程的倒塌和破坏,严重威胁人民群众生命及财产安

1。因此,精确预测基坑工程的支撑轴力具有重要的意义。

常见的数值预测方法可大致分为三类:参数模型法、传统机器学习法和深度学习法。参数模型法通过建立变量之间的线性关系模型,来预测支撑轴力的发展趋势,典型方法包括回归分析法(Regression Analysis, RA),指数平滑模型法(Exponential Smoothing Model, ESM)和差分自回归移动平均模型(Autoregressive Integrated Moving Average Model, ARIMA)等。这些方法考虑了数据的时序特征,但对于非线性的数据适应性较差。使用传统的机器学习方法,如反向传播神经网络(Back⁃Propagation Neural Network, BP)、随机森林模型(Random Forest, RF)和支持向量机(Support Vector Machine, SVM)等模型,虽然能够描述数据的非线性关系,但在处理数据时序特征时高度依赖人工处理,在时序预测方面效果较差。近年来,深度学习方法逐渐脱颖而出,该方法能构建非线性映射,具备强大的自主学习和适应能力,适用于各种复杂的非线性问题,在时间序列数据的预测中也取得了显著进展。

目前主流的研究已经证明,神经网络算法能够很好的处理时序预测问题,但大多研究仅针对单特征数据,且未考虑相近区域带来的空间因素和其余相关因素的影响。袁金荣

2对比了灰色系统模型(Grey System Model, GSM)和神经网络算法在地下连续墙水平位移的预测结果,建立了简单时间序列分析方法,结果表明神经网络是解决基坑位移预测的有效方法。T.G.Feng3和孟凡丽4使用BP神经网络研究地下围护结构的变形趋势,发现BP神经网络有效但鲁棒性较差,对参数和权重的选择依赖性高。胡少伟5使用粒子群算法优化的BP神经网络对边坡稳定性问题建模,提高了神经网络的预测精度和收敛速度。L.L.Yu6和李彦杰7均使用BP模型及其组合模型研究深基坑群桩轴力和变形预测,结果表明组合模型相比于单一BP模型预测的精度更高,且对原始数据的噪音敏感度不高;谢洋洋8,Q.Zhu9,李立云10结合遗传算法和SVM模型对基坑中支撑轴力和变形进行预测研究,结果表明经过遗传算法优化后的SVM模型精度比传统BP模型更高,但由于算法中包含优化后的预测数据,可能会导致原始数据的不纯净;徐浩峰11和曹净12考虑到基坑数据中有明显的时序特征,使用自回归移动平均模型(autoregressive moving average model, ARMA)对支撑轴力数据做回归预测,对于相对稳定的数据效果很好。刘俊城13和H.L.Li14在LSTM网络中使用多步预测来提取数据的时序特征,结果表明使用LSTM神经网络用于基坑数值预测是有效的,且精度指标优于传统神经网络模型。

基坑中钢支撑的轴力是反应基坑安全状态的重要指标。对钢支撑布设测点,单个轴力测点的变化可看作一个动态函数,是一个复杂且不确定的非线性模型,具有时间序列特征,对于同支撑的多个测点,还具有潜在的空间影响因素。本文以上海某基坑工程为例,使用能够提取空间特征的图卷积神经网络GCN,和用于处理时间序列模型的长短周期记忆网络LSTM进行组合建模,使用该模型对基坑钢支撑的轴力变化规律进行预测研究,为相关工程提供指导。

1 研究方法

使用图卷积神经网络(GCN)和长短周期记忆网络(LSTM)相组合的方法,对基坑内钢支撑的轴力进行建模预测。其中,GCN模型用于处理支撑轴力数据的空间关系,LSTM则用于对支撑轴力数据进行时间序列的预测。

1.1 GCN图卷积神经网络

GCN是一种用于图数据的深度学习模型,能够处理节点之间存在关系的数据。它是一种半监督学习方法,适用于节点分类、链接预测、社交网络分析等任

15⁃16。这些场景的联系方式通常是非欧的,使用传统的图形神经网络CNN等很难处理这些数据。GCN模型的主要方法包括图表示,邻居聚合和图卷积层。GCN处理的数据是图,图由节点(或顶点)和边组成。每个节点表示一个实体,每条边表示节点之间的关系,如图1所示,GCN通过聚合每个节点的邻居信息来生成节点的表示。每个节点的表示是其本身特征与邻居节点特征的加权平均。这种聚合方式允许节点将邻居的信息纳入考虑,从而捕获节点之间的结构信息,邻接矩阵见图2

图1  三点邻接示意

Fig.1  Three-point adjacency diagram

注:  图中A与B, C存在邻接关系,B与C之间不相邻

图2  三点邻接矩阵

Fig.2  Three-point adjacency matrix

GCN中的核心是图卷积层,它执行邻居特征的聚合。每个图卷积层将每个节点的特征与其邻居的特征相结合,并通过权重矩阵进行加权聚合。这个权重矩阵通过图的邻接矩阵和节点的度来计算。最终GCN的传播公式表达为:

Hl+1=σ(D˜-1/2A˜D˜-1/2H(l)W(l)) (1)

式中,σ为全局非线性激活函数,可用Sigmoid,ReLU函数。

Sigmoidx=11+e-x (2)
ReLUx=x(x>0)0(x0) (3)

Sigmoid函数的输出范围在0到1之间,函数平滑易于求导,是LSTM神经网络的常用激活函数,也是本文中使用的激活函数。ReLU是一个非饱和非线性函数,有助于减轻梯度消失的问题,使得神经网络能够更好的学习长期依赖关系。D˜为度矩阵是邻接矩阵的均值表示,A˜=A+I表示邻接矩阵中添加一条指向自己的边,A表示初始邻接矩阵可参考图2H(l)表示l时刻的隐藏状态,如果l为初始状态则H(l)直接表示为点位的数值XW(l)表示l时刻的权重值。

1.2 LSTM长短期记忆网络

LSTM是一种特殊类型的循环神经网络(RNN),能够解决传统RNN中的长期依赖问题。传统RNN在处理长序列数据时,容易出现梯度消失或梯度爆炸的问题,导致难以捕获长期时间关

17⁃18。LSTM通过引入门控机制,有效地解决了这些问题,使其能够在长序列数据上表现优异。近几年来,LSTM被扩展的应用于语言模型,机器翻译等学习任务中,且表现出19

LSTM网络由许多LSTM单元组成,每个LSTM单元都包含了三个门和一个细胞状态。这些门分别是遗忘门Ft(Forget Gate)、输入门It(Input Gate)和输出门Ot(Output Gate)。计算方法如下:

It=σ(XtWxi+Ht-1Whi+bi) (4)
Ft=σ(XtWxf+Ht-1Whf+bf) (5)
Ot=σ(XtWxo+Ht-1Who+bo) (6)

式中,WxiWxfWxoRdxhWhiWhfWhoRhxh分别是当前时刻输入数据Xt和上一时刻隐藏状态Ht-1的权重参数,bibfbo是偏移值,d为输入数,h表示隐藏单元数量。细胞状态Ct负责保留和传递网络在处理序列时的长期信息,由上一时刻细胞状态Ct-1和当前时刻候选细胞状态C˜t决定:

C˜t=tanh (XtWxc+Ht-1Whc+bc) (7)

式中,WxcRdxhWhcRhxh是权重参数,bc是偏移参数。

遗忘门决定哪些信息从细胞状态中被丢弃。它通过计算一个0到1之间的值,来控制上一时刻细胞状态Ct-1中的哪些信息要被保留下来。输入门决定了如何更新当前时刻候选细胞状态C˜t,它会计算一个新的候选值,通过一个0到1之间的值来决定在候选值中哪些信息需要更新。细胞状态会被更新为遗忘门过滤后的旧细胞状态与输入门过滤后的候选值的和:

Ct=Ft*Ct-1+It*C˜t (8)

输出门控制细胞状态中的哪些信息将被输出。它将细胞状态Ct传递给tanh函数,然后和输出门的值相乘,得到LSTM单元的输出:

Ht=Ot*tanh (Ct) (9)

其中Ht表示t时刻的隐藏状态,在长短期记忆网络中记忆元和隐状态的传播方式如图3所示。

图3  LSTM记忆元和隐藏状态传播

Fig.3  LSTM memory cell and hidden state propagation

2 GCN⁃LSTM组合预测模型

本文基于GCN和LSTM构建了一个能够提取数据时空特征的组合预测模型。根据实际工程中监测点位的分布情况形成邻接矩阵Dnxn,并在实际数据中添加处理后带有空间特征的数据形成新的数据集Sn。对点位An的支撑轴力Zn进行预测。式中,Sn=f(Zn,Zñ,Tn)为三维特征数据集,f表示数据预处理,Zn表示点n原始支撑轴力数据,Zñ表示经过邻接矩阵变换后的空间特征,Tn表示温度数据。

2.1 算法设计

图4为GCN⁃LSTM的实现过程。基于LSTM的基坑轴力预测模型只能反映测点本身的时间序列特征,存在精度不高,泛化能力差等问

20。本文采用多个特征的数据集,加入经过GCN算法处理的具有空间特征的数据,来提高模型的预测能力。具体实现步骤如下:(1)构建多点位的基础数据集,按时间顺序排列并进行数据预处理,使用卡尔曼滤波对原始数据进行降噪。(2)根据实际空间分布生成邻接矩阵D,将基础数据X与邻接矩阵D相乘形成带有空间信息的特征。(3)调整LSTM训练参数,数据集的分割比例,特征权重等变量。(4)建立LSTM模型用于数值预测,结合评价指标来分析参数的优劣。(5)重复3,4的步骤获得更低的损失,来确定最终模型参数并分析结果。(6)得到最终的GCN⁃LSTM组合算法预测模型,以预测实际钢支撑中轴力的值。

图4  GCN⁃LSTM的实现

Fig.4  Implementation of GCN-LSTM model

2.2 评价指标

使用平均绝对误差(Mean Absolute Error, MAE)和均方根误差(Root Mean Square Error, RMSE)作为模型精度的评价指标。两者的计算公式如下:

MAE=1ni=1n|yi-y¯i| (10)
RMSE=1ni=1n(yi-y¯i)2 (11)

式中,n表示样本数量,yi表示第i个样本实际数值,y¯i表示第i个样本预测数值。MAE输出的数据较为直观,可以直接反应预测数据整体的分布情况,一般得出的数值较小;RMSE则对较大误差的数据更为敏感,由于进行了平方操作,会放大离散数据的影响。同时选用两者作为评价指标可以同时关注数据的整体的稳定性和局部的异常值。

3 工程实例

上海某车站基坑项目位于浦东新区,车站内径长度540.8 m,标准段宽度29.5 m,分为三个基坑,采用明挖顺做法施工。标准段基坑深度约17.2 m,南端头井深度约18.7 m,北端头井深度约18.8 m。标准段17⁃36轴设有5道支撑,其中第一道支撑为砼支撑,其余为钢支撑。现对钢支撑布设测点,其截面尺寸为609t=16 mm),监测设备选择振弦式表面应变计,焊接于测点的两侧并保证安装方向与轴力方向平行,选取有邻接关系的5个点位Y01~Y05进行数据分析,俯视测点如图5所示,采集时间从2023年2月8日到2023年8月12日共530期数据。

图5  测点示意

Fig.5  Schematic diagram of measuring points

3.1 数据构造和参数设置

原始数据包括支撑轴力和传感器温度两个特征,根据时间顺序排序后,使用卡尔曼滤波对原始数据进行降噪预处理,卡尔曼滤波能最小化估计误差的期望值,输出系统状态的最优估计,广泛的用于数据降噪,其计算方法如下:

Xi+1=1-Ki+1Xi+Ki+1Zi+1 (12)
Ki+1=(Pi+Q)/(Pi+Q+R) (13)

式中,X为过滤后的输出值,Z为输入数据,K为卡尔曼增益系数,由上一次输出值的方差P,系统噪声Q和测量噪声R决定,其中Q和R为常量。支撑轴力汇总如图6所示。将数据集分按比例8∶1∶1分为训练集,测试集和预测集。这种划分比例能够最大限度的利用数据对模型进行训练,同时兼顾了评估需求和泛化能力。

图6  原始数据

Fig.6  Raw data

使用pytorch框架设计算法,网络第一层为GCN层,根据实际点位空间关系形成邻接矩阵。第二层为LSTM层,首先对数据进行归一化处理防止梯度异常变化,归一化方法:

x˜=x-xminxmax-xmin (14)

式中,xmax为特征最大值,xmin为特征最小值。设置时间步长为12,隐藏层数量12,批量大小24,学习率为0.001,迭代次数为2 000。第三层为输出层,输出特征数量为1,根据空间关系形成的邻接矩阵如图7所示。

图7  Y01⁃Y05邻接矩阵

Fig.7  Adjacency matrix of Y01-Y05

3.2 结果分析

分别使用LSTM和GCN⁃LSTM组合模型,进行预测分析,并将训练数据和结果如图8图9所示。对于图中训练数据集,可看出组合模型的收敛速度更快,精度更高,单一LSTM模型仅能拟合出数据趋势。针对最后52期预测数据进行分析,发现引入空间特征后预测数据明显更接近于实测值。考虑到Y01的原始数据集在3月1日~3月25日左右下降明显,且整体数据和另外四个点位相比更为离散,为保证后续研究对比的可靠性,在实际预测时摒弃了Y01。

图8  支撑轴力原始数据,LSTM预测数据和GCN⁃LSTM训练数据对比

Fig.8  Comparison of support axial force raw data, predicted data based on the LSTM model, and training data based on the GCN-LSTM model

图9  支撑轴力原始数据,LSTM预测数据和GCN⁃LSTM预测数据对比

Fig.9  Comparison of support axial force raw data, LSTM predicated data, and GCN-LSTM predicted data

以Y05为例,单一LSTM预测数据的稳定性较好,最大浮动为0.681,约为平均数据的11%,在短预测周期时,LTSM的预测值会更靠近真实值,对于更长的预测周期,LSTM模型也能够反映出数据变化的趋势,这证明模型本身可以较为准确的捕捉到数据的时序特征。对于其他的三条曲线,Y03和Y04仅能反映出数据的变化趋势,离实测值相差较大;Y02的拟合效果不错,但在图像上表现的不明显,这可能是由于后段数据变化量过大。

对于GCN⁃LSTM组合模型,预测集的波动较为明显,和原始数据的拟合程度较高,对于Y04和Y05两个点位的数据更为明显,组合模型的曲线变化趋势与真实数据较为接近,对于Y03这条数据稳定的点位,能看出组合模型的性能优于单一LSTM模型,在训练集上也能看出组合模型的收敛速度更快,准确度更高。

两种模型的预测精度指标见表 1,与单一LSTM模型相比,引入空间特征的GCN⁃LSTM组合模型在MAE和RMSE上均有所下降,4个点位轴力数据的MAE分别下降了28.86%,45.74%,42.83%,38.62%;RMSE分别下降了19.22%,42.55%,33.88%,34.91%。

表1  评价指标MAE和RMSE单位:MPa
Table 1  Evaluation metrics of MAE and RMSE
Y02Y03Y04Y05
MAE GCN⁃LSTM 0.383 0.383 0.494 0.283
LSTM 0.539 0.706 0.863 0.462
误差下降/% 28.86 45.74 42.83 38.62
RMSE GCN⁃LSTM 0.493 0.414 0.608 0.356
LSTM 0.610 0.721 0.920 0.548
误差下降/% 19.22 42.55 33.88 34.91

4 结 论

(1)LSTM和GCN⁃LSTM组合模型均能用于支撑轴力的预测,其中单一LSTM模型稳定性较好,但无法体现数据的波动性,拟合能力较差;GCN⁃LSTM组合模型的拟合能力强,对于长周期的数据预测仍有良好的变现。

(2)使用两种方法分别对上海某车站4个点位的支撑轴力数据进行预测分析,结果表明GCN⁃LSTM组合模型在平均绝对误差和均方根误差上均优于单一LSTM模型。其中平均绝对误差性能提升超过28.86%,均方根误差性能提升超过19.22%,这表明GCN⁃LSTM组合模型可以有效用于实际支撑轴力的预测,该方法可为实际工程提供参考。

(3)GCN模型仅考虑节点的一阶邻接关系,这可能导致模型无法捕捉跨节点的邻接信息,对于更复杂的空间关系处理仍需进行研究。

参考文献

1

刘汉龙马彦彬仉文岗.大数据技术在地质灾害防治中的应用综述[J].防灾减灾工程学报2021414):710-722. [百度学术] 

Liu H LMa Y BZhang W G. Overview of the application of big data technology in geological disaster prevention and control[J]. Journal of Disaster Prevention and Mitigation Engineering2021414): 710-722.(in Chinese) [百度学术] 

2

袁金荣赵福勇.基坑变形预测的时间序列分析[J].土木工程学报2001346):55-59. [百度学术] 

Yuan J RZhao F Y. Time series analysis for deformation prediction of foundation pits[J]. Journal of Civil Engineering2001346): 55-59.(in Chinese) [百度学术] 

3

Feng T GWang C RZhang Jet al. Prediction of stratum deformation during the excavation of a foundation pit in composite formation based on the artificial bee colony–back-propagation model[J]. Engineering Optimization2022547): 1217-1235. [百度学术] 

4

孟凡丽郑棋李燕.基于BP神经网络的深基坑围护变形预测[J].浙江工业大学学报2014424):367-372. [百度学术] 

Meng F LZheng QLi Yet al. Deformation prediction of deep foundation pit support based on BP neural network[J]. Journal of Zhejiang University of Technology2014424): 367-372.(in Chinese) [百度学术] 

5

胡少伟李原昊单常喜.基于改进的PSO-BP神经网络的边坡稳定性研究[J].防灾减灾工程学报2023434):854-861. [百度学术] 

Hu S WLi Y HShan C Xet al. Study on slope stability based on an improved PSO-BP neural network[J]. Journal of Disaster Prevention and Mitigation Engineering2023434): 854-861.(in Chinese) [百度学术] 

6

Yu L LLiu X XSu Let al. Research on the back propagation neural network haze prediction model based on particle swarm optimization[C]∥2020 International Conference on Computer Engineering and Application (ICCEA). IEEE2020344-348. [百度学术] 

7

李彦杰薛亚东岳磊.基于遗传算法-BP神经网络的深基坑变形预测[J].地下空间与工程学报201511增2):741-749. [百度学术] 

Li Y JXue Y DYue Let al. Deep foundation pit deformation prediction based on genetic algorithm-BP neural network[J]. Chinese Journal of Underground Space and Engineering201511Sup2): 741-749.(in Chinese) [百度学术] 

8

谢洋洋付超吴大鹏.利用PSO-GA-LSSVM模型预测基坑周边建筑物沉降[J].测绘地理信息2021463):50-54. [百度学术] 

Xie Y YFu CWu D Pet al. Prediction of settlement around foundation pits using the PSO-GA-LSSVM model[J]. Geomatics and Information Science of Wuhan University2021463): 50-54.(in Chinese) [百度学术] 

9

Zhu QLuo Y LZhou D Yet al. Drought prediction using in situ and remote sensing products with SVM over the Xiang River Basin, China[J]. Natural Hazards20211052161-2185. [百度学术] 

10

李立云孙庆玺.基坑开挖诱发既有建(构)筑物变形的SVM-BP预测模型及其工程应用[J].防灾科技学院学报2020222):1-9. [百度学术] 

Li L YSun Q X. SVM-BP prediction model for deformation of existing buildings induced by foundation pit excavation and its engineering application[J]. Journal of Institute of Disaster Prevention Science and Technology2020222): 1-9.(in Chinese) [百度学术] 

11

徐浩峰应宏伟朱向荣.时间序列分析方法预报基坑支撑轴力[J].水利学报2004351):105-109. [百度学术] 

Xu H FYing H WZhu X R. Time series analysis method for predicting axial force in foundation pitsupport[J]. Journal of Hydraulic Engineering2004351): 105-109.(in Chinese) [百度学术] 

12

曹净丁文云赵党书.基于LSSVM-ARMA模型的基坑变形时间序列预测[J].岩土力学201435增2):579-586. [百度学术] 

Cao JDing W YZhao D Set al. Time series prediction of foundation pit deformation based on the LSSVM-ARMA model[J]. Rock and Soil Mechanics201435Sup2): 579-586.(in Chinese) [百度学术] 

13

刘俊城谭勇张生杰.地铁车站深基坑开挖变形智能多步预测方法[J].上海交通大学学报2023587): 1108-1117. [百度学术] 

Liu J CTan YZhang S J. Intelligent multi-step prediction method for deformation during deep foundation pit excavation at subway stations[J]. Journal of Shanghai Jiao Tong University2023587): 1108-1117.(in Chinese) [百度学术] 

14

Li H LZhao Z ZDu X. Research and application of deformation prediction model for deep foundation pit based on LSTM[J]. Wireless Communications and Mobile Computing202220221): 9407999. [百度学术] 

15

Zheng JWang YXu W Jet al. GSSA: Pay attention to graph feature importance for GCN via statistical self-attention[J]. Neurocomputing2020417458-470. [百度学术] 

16

Li SLi W TWang W. Co-gcn for multi-view semi-supervised learning[C]∥Proceedings of the AAAI conference on artificial intelligence. New yorkNew YOrk Hilton Midtown20204691-4698. [百度学术] 

17

Zhou XWu X TDing Pet al. Research on transformer partial discharge UHF pattern recognition based on CNN-lSTM[J]. Energies2019131): 61. [百度学术] 

18

Hakim N LShih T KKasthuri Arachchi S Pet al. Dynamic hand gesture recognition using 3DCNN and LSTM with FSM context-aware model[J]. Sensors20191924): 5429. [百度学术] 

19

杨丽吴雨茜王俊丽.循环神经网络研究综述[J].计算机应用201838增2):1-6, 26. [百度学术] 

Yang LWu Y XWang J Let al. A review on recurrent neural networks[J]. Journal of Computer Applications201838Sup2): 1-6, 26.(in Chinese) [百度学术] 

20

万磊余飞鲁统伟.基于CEEMDAN-CNN-GRU组合模型的短期负荷预测方法[J].河北科技大学学报2022432):154-161. [百度学术] 

Wan LYu FLu T Wet al. Short-term load forecasting method based on the combination of CEEMDAN-CNN-GRU model[J]. Journal of Hebei University of Scienceand Technology2022432): 154-161.(in Chinese) [百度学术]