摘要
基坑钢支撑的轴力变化是反应基坑中内力变化的重要指标,也是基坑工程灾害防治的重点研究对象。由于土体力学性质的复杂性以及受力演化的不确定性,单纯通过监测和计算难以把握基坑中实际的内力变化趋势。已有研究表明支撑轴力的演化具有典型的时序特征,可使用时间序列预测模型对数据进行预测分析,但预测精度普遍不高。基坑中多个点位的支撑轴力变化往往具有明显的空间相关性,但现有的模型无法捕捉空间信息。为解决上述问题,使用图卷积神经网络(Graph Convolutional Neural Network, GCN)和长短期记忆网络(Long Short⁃Term Memory, LSTM),组合构建了能捕捉数据时间和空间特征的时空序列预测模型。该模型根据实际点位的空间信息构建了邻接矩阵并生成对应的空间特征,以支撑轴力,空间信息,温度作为输入特征,来预测支撑轴力的发展趋势。使用上海某车站项目中四个具有空间相关性的点位数据进行预测分析,并将组合模型的预测结果与实测数据、单一LSTM模型预测数据进行对比,结果表明:(1)组合模型的收敛速度更快,对于长周期的数据拟合能力更强,并且能更好的反应数据的波动性;(2)组合模型的精度高于仅考虑时间序列特征的单一LSTM模型,有效提高了支撑轴力数据的预测精度。该模型可为实际工程数值预测提供计算参考。
随着社会的快速发展,深基坑工程项目逐渐增多,基坑工程的安全问题成了关注重点。基坑开挖卸荷会引起坑内外土压力的失衡,而支护结构尤其是支撑将起到抵抗外侧土压力保护基坑的作用,其设计支撑所起的作用即支撑轴力需要重点监测。由于土体力学性质的复杂性以及受力演化的不确定性,实际的监测数据可能会和设计计算的不一致,单纯的监测难以把握基坑支撑轴力的发展规律。而工程支护结构一旦受损,可能导致地下工程的倒塌和破坏,严重威胁人民群众生命及财产安
常见的数值预测方法可大致分为三类:参数模型法、传统机器学习法和深度学习法。参数模型法通过建立变量之间的线性关系模型,来预测支撑轴力的发展趋势,典型方法包括回归分析法(Regression Analysis, RA),指数平滑模型法(Exponential Smoothing Model, ESM)和差分自回归移动平均模型(Autoregressive Integrated Moving Average Model, ARIMA)等。这些方法考虑了数据的时序特征,但对于非线性的数据适应性较差。使用传统的机器学习方法,如反向传播神经网络(Back⁃Propagation Neural Network, BP)、随机森林模型(Random Forest, RF)和支持向量机(Support Vector Machine, SVM)等模型,虽然能够描述数据的非线性关系,但在处理数据时序特征时高度依赖人工处理,在时序预测方面效果较差。近年来,深度学习方法逐渐脱颖而出,该方法能构建非线性映射,具备强大的自主学习和适应能力,适用于各种复杂的非线性问题,在时间序列数据的预测中也取得了显著进展。
目前主流的研究已经证明,神经网络算法能够很好的处理时序预测问题,但大多研究仅针对单特征数据,且未考虑相近区域带来的空间因素和其余相关因素的影响。袁金荣
基坑中钢支撑的轴力是反应基坑安全状态的重要指标。对钢支撑布设测点,单个轴力测点的变化可看作一个动态函数,是一个复杂且不确定的非线性模型,具有时间序列特征,对于同支撑的多个测点,还具有潜在的空间影响因素。本文以上海某基坑工程为例,使用能够提取空间特征的图卷积神经网络GCN,和用于处理时间序列模型的长短周期记忆网络LSTM进行组合建模,使用该模型对基坑钢支撑的轴力变化规律进行预测研究,为相关工程提供指导。
使用图卷积神经网络(GCN)和长短周期记忆网络(LSTM)相组合的方法,对基坑内钢支撑的轴力进行建模预测。其中,GCN模型用于处理支撑轴力数据的空间关系,LSTM则用于对支撑轴力数据进行时间序列的预测。
GCN是一种用于图数据的深度学习模型,能够处理节点之间存在关系的数据。它是一种半监督学习方法,适用于节点分类、链接预测、社交网络分析等任

图1 三点邻接示意
Fig.1 Three-point adjacency diagram
注: 图中A与B, C存在邻接关系,B与C之间不相邻

图2 三点邻接矩阵
Fig.2 Three-point adjacency matrix
GCN中的核心是图卷积层,它执行邻居特征的聚合。每个图卷积层将每个节点的特征与其邻居的特征相结合,并通过权重矩阵进行加权聚合。这个权重矩阵通过图的邻接矩阵和节点的度来计算。最终GCN的传播公式表达为:
(1) |
式中,为全局非线性激活函数,可用Sigmoid,ReLU函数。
(2) |
(3) |
Sigmoid函数的输出范围在0到1之间,函数平滑易于求导,是LSTM神经网络的常用激活函数,也是本文中使用的激活函数。ReLU是一个非饱和非线性函数,有助于减轻梯度消失的问题,使得神经网络能够更好的学习长期依赖关系。为度矩阵是邻接矩阵的均值表示,表示邻接矩阵中添加一条指向自己的边,表示初始邻接矩阵可参考
LSTM是一种特殊类型的循环神经网络(RNN),能够解决传统RNN中的长期依赖问题。传统RNN在处理长序列数据时,容易出现梯度消失或梯度爆炸的问题,导致难以捕获长期时间关
LSTM网络由许多LSTM单元组成,每个LSTM单元都包含了三个门和一个细胞状态。这些门分别是遗忘门(Forget Gate)、输入门(Input Gate)和输出门(Output Gate)。计算方法如下:
(4) |
(5) |
(6) |
式中,,,和,,分别是当前时刻输入数据和上一时刻隐藏状态的权重参数,,,是偏移值,为输入数,表示隐藏单元数量。细胞状态负责保留和传递网络在处理序列时的长期信息,由上一时刻细胞状态和当前时刻候选细胞状态决定:
(7) |
式中,和是权重参数,是偏移参数。
遗忘门决定哪些信息从细胞状态中被丢弃。它通过计算一个0到1之间的值,来控制上一时刻细胞状态中的哪些信息要被保留下来。输入门决定了如何更新当前时刻候选细胞状态,它会计算一个新的候选值,通过一个0到1之间的值来决定在候选值中哪些信息需要更新。细胞状态会被更新为遗忘门过滤后的旧细胞状态与输入门过滤后的候选值的和:
(8) |
输出门控制细胞状态中的哪些信息将被输出。它将细胞状态传递给tanh函数,然后和输出门的值相乘,得到LSTM单元的输出:
(9) |
其中表示时刻的隐藏状态,在长短期记忆网络中记忆元和隐状态的传播方式如

图3 LSTM记忆元和隐藏状态传播
Fig.3 LSTM memory cell and hidden state propagation
本文基于GCN和LSTM构建了一个能够提取数据时空特征的组合预测模型。根据实际工程中监测点位的分布情况形成邻接矩阵,并在实际数据中添加处理后带有空间特征的数据形成新的数据集。对点位的支撑轴力进行预测。式中,为三维特征数据集,表示数据预处理,表示点原始支撑轴力数据,表示经过邻接矩阵变换后的空间特征,表示温度数据。

图4 GCN⁃LSTM的实现
Fig.4 Implementation of GCN-LSTM model
上海某车站基坑项目位于浦东新区,车站内径长度540.8 m,标准段宽度29.5 m,分为三个基坑,采用明挖顺做法施工。标准段基坑深度约17.2 m,南端头井深度约18.7 m,北端头井深度约18.8 m。标准段17⁃36轴设有5道支撑,其中第一道支撑为砼支撑,其余为钢支撑。现对钢支撑布设测点,其截面尺寸为(t=16 mm),监测设备选择振弦式表面应变计,焊接于测点的两侧并保证安装方向与轴力方向平行,选取有邻接关系的5个点位Y01~Y05进行数据分析,俯视测点如

图5 测点示意
Fig.5 Schematic diagram of measuring points
原始数据包括支撑轴力和传感器温度两个特征,根据时间顺序排序后,使用卡尔曼滤波对原始数据进行降噪预处理,卡尔曼滤波能最小化估计误差的期望值,输出系统状态的最优估计,广泛的用于数据降噪,其计算方法如下:
(12) |
(13) |
式中,为过滤后的输出值,为输入数据,为卡尔曼增益系数,由上一次输出值的方差,系统噪声Q和测量噪声R决定,其中Q和R为常量。支撑轴力汇总如

图6 原始数据
Fig.6 Raw data
使用pytorch框架设计算法,网络第一层为GCN层,根据实际点位空间关系形成邻接矩阵。第二层为LSTM层,首先对数据进行归一化处理防止梯度异常变化,归一化方法:
(14) |
式中,为特征最大值,为特征最小值。设置时间步长为12,隐藏层数量12,批量大小24,学习率为0.001,迭代次数为2 000。第三层为输出层,输出特征数量为1,根据空间关系形成的邻接矩阵如

图7 Y01⁃Y05邻接矩阵
Fig.7 Adjacency matrix of Y01-Y05
分别使用LSTM和GCN⁃LSTM组合模型,进行预测分析,并将训练数据和结果如

图8 支撑轴力原始数据,LSTM预测数据和GCN⁃LSTM训练数据对比
Fig.8 Comparison of support axial force raw data, predicted data based on the LSTM model, and training data based on the GCN-LSTM model

图9 支撑轴力原始数据,LSTM预测数据和GCN⁃LSTM预测数据对比
Fig.9 Comparison of support axial force raw data, LSTM predicated data, and GCN-LSTM predicted data
以Y05为例,单一LSTM预测数据的稳定性较好,最大浮动为0.681,约为平均数据的11%,在短预测周期时,LTSM的预测值会更靠近真实值,对于更长的预测周期,LSTM模型也能够反映出数据变化的趋势,这证明模型本身可以较为准确的捕捉到数据的时序特征。对于其他的三条曲线,Y03和Y04仅能反映出数据的变化趋势,离实测值相差较大;Y02的拟合效果不错,但在图像上表现的不明显,这可能是由于后段数据变化量过大。
对于GCN⁃LSTM组合模型,预测集的波动较为明显,和原始数据的拟合程度较高,对于Y04和Y05两个点位的数据更为明显,组合模型的曲线变化趋势与真实数据较为接近,对于Y03这条数据稳定的点位,能看出组合模型的性能优于单一LSTM模型,在训练集上也能看出组合模型的收敛速度更快,准确度更高。
两种模型的预测精度指标见
Y02 | Y03 | Y04 | Y05 | ||
---|---|---|---|---|---|
MAE | GCN⁃LSTM | 0.383 | 0.383 | 0.494 | 0.283 |
LSTM | 0.539 | 0.706 | 0.863 | 0.462 | |
误差下降/% | 28.86 | 45.74 | 42.83 | 38.62 | |
RMSE | GCN⁃LSTM | 0.493 | 0.414 | 0.608 | 0.356 |
LSTM | 0.610 | 0.721 | 0.920 | 0.548 | |
误差下降/% | 19.22 | 42.55 | 33.88 | 34.91 |
(1)LSTM和GCN⁃LSTM组合模型均能用于支撑轴力的预测,其中单一LSTM模型稳定性较好,但无法体现数据的波动性,拟合能力较差;GCN⁃LSTM组合模型的拟合能力强,对于长周期的数据预测仍有良好的变现。
(2)使用两种方法分别对上海某车站4个点位的支撑轴力数据进行预测分析,结果表明GCN⁃LSTM组合模型在平均绝对误差和均方根误差上均优于单一LSTM模型。其中平均绝对误差性能提升超过28.86%,均方根误差性能提升超过19.22%,这表明GCN⁃LSTM组合模型可以有效用于实际支撑轴力的预测,该方法可为实际工程提供参考。
(3)GCN模型仅考虑节点的一阶邻接关系,这可能导致模型无法捕捉跨节点的邻接信息,对于更复杂的空间关系处理仍需进行研究。
参考文献
刘汉龙,马彦彬,仉文岗.大数据技术在地质灾害防治中的应用综述[J].防灾减灾工程学报,2021,41(4):710-722. [百度学术]
Liu H L, Ma Y B, Zhang W G. Overview of the application of big data technology in geological disaster prevention and control[J]. Journal of Disaster Prevention and Mitigation Engineering, 2021, 41(4): 710-722.(in Chinese) [百度学术]
袁金荣,赵福勇.基坑变形预测的时间序列分析[J].土木工程学报,2001,34(6):55-59. [百度学术]
Yuan J R, Zhao F Y. Time series analysis for deformation prediction of foundation pits[J]. Journal of Civil Engineering, 2001, 34(6): 55-59.(in Chinese) [百度学术]
Feng T G, Wang C R, Zhang J, et al. Prediction of stratum deformation during the excavation of a foundation pit in composite formation based on the artificial bee colony–back-propagation model[J]. Engineering Optimization, 2022, 54(7): 1217-1235. [百度学术]
孟凡丽,郑棋,李燕,等.基于BP神经网络的深基坑围护变形预测[J].浙江工业大学学报,2014,42(4):367-372. [百度学术]
Meng F L, Zheng Q, Li Y, et al. Deformation prediction of deep foundation pit support based on BP neural network[J]. Journal of Zhejiang University of Technology, 2014, 42(4): 367-372.(in Chinese) [百度学术]
胡少伟,李原昊,单常喜,等.基于改进的PSO-BP神经网络的边坡稳定性研究[J].防灾减灾工程学报,2023,43(4):854-861. [百度学术]
Hu S W, Li Y H, Shan C X, et al. Study on slope stability based on an improved PSO-BP neural network[J]. Journal of Disaster Prevention and Mitigation Engineering, 2023, 43(4): 854-861.(in Chinese) [百度学术]
Yu L L, Liu X X,Su L, et al. Research on the back propagation neural network haze prediction model based on particle swarm optimization[C]∥2020 International Conference on Computer Engineering and Application (ICCEA). IEEE, 2020: 344-348. [百度学术]
李彦杰, 薛亚东, 岳磊, 等.基于遗传算法-BP神经网络的深基坑变形预测[J].地下空间与工程学报,2015,11(增2):741-749. [百度学术]
Li Y J, Xue Y D, Yue L, et al. Deep foundation pit deformation prediction based on genetic algorithm-BP neural network[J]. Chinese Journal of Underground Space and Engineering, 2015, 11(Sup2): 741-749.(in Chinese) [百度学术]
谢洋洋, 付超, 吴大鹏, 等.利用PSO-GA-LSSVM模型预测基坑周边建筑物沉降[J].测绘地理信息,2021,46(3):50-54. [百度学术]
Xie Y Y, Fu C, Wu D P, et al. Prediction of settlement around foundation pits using the PSO-GA-LSSVM model[J]. Geomatics and Information Science of Wuhan University, 2021, 46(3): 50-54.(in Chinese) [百度学术]
Zhu Q, Luo Y L, Zhou D Y, et al. Drought prediction using in situ and remote sensing products with SVM over the Xiang River Basin, China[J]. Natural Hazards, 2021, 105: 2161-2185. [百度学术]
李立云,孙庆玺.基坑开挖诱发既有建(构)筑物变形的SVM-BP预测模型及其工程应用[J].防灾科技学院学报,2020,22(2):1-9. [百度学术]
Li L Y, Sun Q X. SVM-BP prediction model for deformation of existing buildings induced by foundation pit excavation and its engineering application[J]. Journal of Institute of Disaster Prevention Science and Technology, 2020, 22(2): 1-9.(in Chinese) [百度学术]
徐浩峰,应宏伟,朱向荣.时间序列分析方法预报基坑支撑轴力[J].水利学报,2004,35(1):105-109. [百度学术]
Xu H F, Ying H W, Zhu X R. Time series analysis method for predicting axial force in foundation pitsupport[J]. Journal of Hydraulic Engineering, 2004, 35(1): 105-109.(in Chinese) [百度学术]
曹净,丁文云,赵党书,等.基于LSSVM-ARMA模型的基坑变形时间序列预测[J].岩土力学,2014,35(增2):579-586. [百度学术]
Cao J, Ding W Y, Zhao D S, et al. Time series prediction of foundation pit deformation based on the LSSVM-ARMA model[J]. Rock and Soil Mechanics, 2014, 35(Sup2): 579-586.(in Chinese) [百度学术]
刘俊城,谭勇,张生杰.地铁车站深基坑开挖变形智能多步预测方法[J].上海交通大学学报,2023,58(7): 1108-1117. [百度学术]
Liu J C, Tan Y, Zhang S J. Intelligent multi-step prediction method for deformation during deep foundation pit excavation at subway stations[J]. Journal of Shanghai Jiao Tong University, 2023,58(7): 1108-1117.(in Chinese) [百度学术]
Li H L, Zhao Z Z, Du X. Research and application of deformation prediction model for deep foundation pit based on LSTM[J]. Wireless Communications and Mobile Computing, 2022, 2022(1): 9407999. [百度学术]
Zheng J, Wang Y, Xu W J, et al. GSSA: Pay attention to graph feature importance for GCN via statistical self-attention[J]. Neurocomputing, 2020, 417: 458-470. [百度学术]
Li S, Li W T, Wang W. Co-gcn for multi-view semi-supervised learning[C]∥Proceedings of the AAAI conference on artificial intelligence. New york: New YOrk Hilton Midtown, 2020: 4691-4698. [百度学术]
Zhou X, Wu X T, Ding P, et al. Research on transformer partial discharge UHF pattern recognition based on CNN-lSTM[J]. Energies, 2019, 13(1): 61. [百度学术]
Hakim N L, Shih T K, Kasthuri Arachchi S P, et al. Dynamic hand gesture recognition using 3DCNN and LSTM with FSM context-aware model[J]. Sensors, 2019, 19(24): 5429. [百度学术]