基金项目:湖北省自然科学基金面上项目(2022CFB294); 国家自然科学基金青年科学项目(52208485).
第一作者简介:周 宇(1997-),硕士研究生在读,主要从事结构抗震与机器学习交叉研究.E-mail:891363206@qq.com.
通信作者简介:骆 欢(1988-),博士,副教授,主要从事结构抗震与机器学习交叉研究.E-mail:hluo@ctgu.edu.cn.
(1.湖北省地质灾害防治工程技术研究中心,湖北 宜昌 443002; 2.三峡大学 土木与建筑学院,湖北 宜昌 443002)
(1.Hubei Geological Disaster Prevention and Control Engineering Technology Research Center,Yichang 443002,Hubei,China;2.College of Civil Engineering & Architecture,China Three Gorges University,Yichang 443002,Hubei,China)
RC frame structures; fragility curves; eigenvectors; support vector machines; machine learning
DOI: 10.20015/j.cnki.ISSN1000-0666.2024.0052
地震易损性分析用于预测不同地震强度下结构发生各级破坏的概率,对结构的抗震设计、加固和维修决策具有重要的应用价值(孙柏涛,张桂欣,2012)。易损性曲线描述了结构在给定地震动强度的情况下超过指定极限状态的概率,是易损性分析中的关键内容。目前,易损性曲线的预测方法有多种(Lallemant et al,2015),如云图法(于晓辉,吕大刚,2016; Jalayer et al,2017; Mattei,Bedon,2021)、增量动力分析(Incremental Dynamic Analysis,IDA)(吕大刚等,2011; 薛成凤等,2017; 路沙沙等,2021; Pujari et al,2013; Vamvatsikos,Cornell,2002)、多条带法(Multiple Sequence Alignment,MSA)(程诗焱等,2020; Fatimah,Wong,2021; Bradley,2010),等等。然而,这些方法都需要通过大量的非线性时程分析计算结构的地震响应结果,进而判断结构在地震作用下的破坏状态,计算成本高,导致易损性曲线预测的计算效率不高。因此,如何高效准确地预测结构的易损性曲线,进而量化评估结构的抗震性能成为结构工程和地震工程领域研究的热点与难点问题。
机器学习(Machine Learning,ML)方法因其强大的数据拟合能力已被广泛运用到结构和地震工程领域,弥补了传统方法的不足。Mitropoulou和Papadrakakis(2011)将人工神经网络(Artificial Neural Network,ANN)与增量动力分析结合提出了基于人工神经网络的易损性曲线预测方法。Kiani等(2019)利用多条带法的结果发展了一种基于机器学习分类模型的易损性预测新方法,并且比较了随机森林、支持向量机、贝叶斯等6种分类模型的结构破坏状态预测效果。Gentile 和Galasso(2020)利用高斯过程回归建立了考虑建筑种类属性的易损性预测模型。研究人员利用支持向量机(Support Vector Machine,SVM)结合时程分析得到的结构响应数据开发了建筑易损性预测模型(李浩瑾等,2013; Mahmoudi,Chouinard,2016; Sainct et al,2020)。以上结果表明,基于机器学习的分析方法既能保证较高的预测性能,又能极大地提高计算效率,这是因为机器学习方法能够自适应地拟合训练数据形成预测模型,无需执行复杂的非线性有限元计算过程。通过建立的预测模型预测结构响应,本质上等同于矩阵与向量的乘积,因此计算效率高。然而,由于机器学习方法在训练过程时需要求解由训练样本所构成的系数矩阵的逆矩阵,这使得当训练样本数据的规模较大时,不仅对计算机的内存需求高,且计算效率低下(James et al,2013)。因此,在大规模训练样本下,机器学习方法就会丧失高效性。
本文将Nystrom近似论(Charless et al,2019)中的特征值与特征向量理论和机器学习方法中的最小二乘支持向量机(Least Squares Support Vector Machine,LS-SVM)(Suykens et al,2000)相结合,提出了特征向量信息支持向量机(Eigenvectors-Informed Support Vector Machines,EILS-SVM)的方法,并从公开数据库(Wang,Luo,2023)提取了4层、6层、8层不同规格RC框架结构的结构响应数据,形成了16 500个样本数据,将EILS-SVM分别与LS-SVM等传统机器学习模型进行对比。
最小二乘支持向量机(LS-SVM)(Suykens,Vandewalle,1999)分类模型是一种较为常用的机器学习算法,其将支持向量机(Support Vector Machine,SVM)(Cervantes et al,2020)中求解二次规划问题转化成了求解线性方程组问题,极大地提高了SVM训练过程的计算效率。其优化问题如下所示:
式中:ξk∈R是定义误差变量的向量; γ为正则化参数; φ(xk)∈Rh是高维输入向量,其中φ(·):Rd→Rh表示从d维到具有h维的高维度Hilbert空间的映射函数。其原始空间下的预测模型表达式为:
y(x)=sign[ωTφ(x)+b] (3)
由于高维输入向量φ(xk)未知,因此由式(1)和(2)构成的优化问题无法直接求解。为此,通过引入拉格朗日乘子αk∈R,构造式(1)和(2)的拉格朗日函数,并在对偶空间里进行求解。拉格朗日函数表达式为:
引入KTT条件求解方程式(4),可得到如下方程组:
式中:K(xk,xl)=φT(xk)φ(xl)为核函数(本文所采用的核函数为高斯核(RBF)函数),通过带入核函数便可在对偶空间中得到模型参数α和b,其在对偶空间下的预测模型表达式如下:
至此,通过对偶空间建立的预测模型便可用于预测新样本数据所属的类别。但是,LS-SVM在求解矩阵方程(5)时,涉及到求解系数矩阵的逆矩阵,其计算复杂度与训练样本的规模N有关,为O[(N+1)3]。当给定训练样本数据{xk,yk}Nk=1的规模N较大时,求解这一大规模矩阵的逆矩阵就会变得极为耗时,造成模型训练过程的计算效率低下。因此,当训练样本的规模N较大时,在LS-SVM标准框架下通过方程(5),在对偶空间下求解模型参数进而构建预测模型(6)就会变得尤为低效。而反观原始空间下预测模型(3),其模型参数ω的维度与高维输入向量φ(xk)的维度h有关,计算复杂度为O[(h+1)3]。因此,即使训练样本数据{xk,yk}Nk=1的规模N较大, 若φ(xk)的维度hN,在原空间中建立预测模型将比在对偶空间下建立预测模型更为高效。这是因为,当hN时,在原始空间建立预测模型的计算复杂度要远远小于对偶空间,即O[(h+1)3]O[(N+1)3]。为了能在原空间建立预测模型,需要显示地构建非线性映射函数φ(·)的数学模型。然而,通常情况下φ(·)的数学模型无法显示。
为了解决这一问题,本文采用Nystrom方法中特征值和特征向量理论(Girolami,2002)近似估计出高维输入向量φ(xk),使得可以在原空间建立预测模型(3),进而解决LS-SVM在大样本训练数据集下预测模型训练效率低下的问题。首先,将方程(5)中由RBF核函数构成的核矩阵记为Ω(N,N)∈RN×N,其中Ω(k,l)=K(xk,xl),k,l=1,…,N。根据Mercer定理(Girolami,2002),可得到如下表达式:
式中:λi和φi分别是特征值和相应的特征函数。这些特征值和特征函数与如下积分方程相关联,其表达式如下:
∫K(xk,x)φi(x)p(x)dx=λiφi(xk)(8)
式中:p(x)表示大规模训练样本输入变量xk的概率密度函数。在给定大规模数据集{xk,yk}Nk=1的条件下,假设输入样本xk,k=1,…,N之间服从独立同分布。为了近似估计特征函数的积分方程,可从大规模训练样本数据中随机抽取m个子样本{xt,yt}mt=1(mN),用子样本中的输入变量xt近似p(x),进而达到稀疏化的目的。基于此,式(8)可通过如下表达式近似:
通过从大样本训练数据集中选取的m个子样本{xt,yt}mk=1可建立相应的核矩阵Ω(m,m),并对核矩阵进行特征值分解,可得到如下方程:
式中:Ω(m,m)∈Rm×m表示近似大规模核矩阵Ω(N,N)的稀疏化核矩阵;,表示由Ω(m,m)的特征向量组成的矩阵;∈Rm×m表示由Ω(m,m)的特征值组成的对角矩阵。
将式(10)中的矩阵进行向量分解,可得到如下表达式:
将式(11)带到方程(9)中可得到第i个特征函数的表达式:
将式(7)与式(12)结合可以得到φ(xk)中第i个元素与第i个特征函数之间的关系式:
根据式(13)即可求出非线性高维向量的显性估计,其中。因此,基于估计的高维输入变量,可利用最小二乘法直接求解由方程(1)和(2)构成的优化问题,进而可求得原空间下预测模型(3)中的模型参数ω和b。其计算公式为:
式中:Im+1为(m+1)×(m+1)的单位矩阵; y=[y1,y2,…,yN]T; 是N×(m+1)特征增广矩阵,具体形式如下:
由方程(14)可知,本文所提出的EILS-SVM模型的计算复杂度与高维映射函数φ(xk)的维度m有关, 为O(m3)。因为mN, 所以O(m3)O(N3)。因此,从理论上分析,本文提出的EILS-SVM模型能显著提高计算效率。此外,由于系数矩阵的规模为(m+1)且(m+1)N,因此EILS-SVM也能显著降低对计算机内存的需求。
基于EILS-SVM的结构破坏状态预测模型的建立步骤如图1所示,具体分为以下8个步骤:
步骤1:建立结构响应数据库,获得不同地震强度和不同地震强度下结构的工程需求参数(Engineering Demand Parameter,EDP)所组成的样本集{IMi,EDPi}ni=1。
步骤2:为样本集{IMi,EDPi}ni=1中的每个样本点提取对应的结构设计变量和地震动参数建立样本信息数据库。
步骤3:基于结构的EDP极限状态阈值,将样本信息数据库中的每个样本点按照EDP是否超过阈值分为两类,从而构建大规模数据集{xk,yk }Nk=1。其中xk=[x1,x2,…,xd]为结构的设计变量和地震动参数组成的向量,yk∈{1,-1}为不同结构破坏状态的类别标签。
步骤4:将数据集划分为训练集与测试集。其中训练集中的部分数据(支持向量)用来训练预测模型,测试集的数据则用来预测结构破坏状态。
步骤5:确定子样本规模大小m(mN)。子样本规模大小直接影响EILS-SVM的性能,m过小会导致EILS-SVM的预测精度较低,m过大则会增加模型的计算成本,降低计算效率。
步骤6:从训练集中随机抽取m个样本作为支持向量用于训练EILS-SVM模型。
步骤7:按照本文提出的EILS-SVM理论求解出模型参数ω和b,建立支持向量机原空间预测模型。
步骤8:将测试集数据输入建立好的原空间预测模型,开展结构在不同地震动强度IMi下的破坏状态的预测。
本文采用公开数据库(Wang,Luo,2023)中的数据集作为EILS-SVM模型的训练数据。该数据集包含广泛分布在我国各大、中、小城市的4层、6层和8层典型RC框架结构,具体数据信息可参阅Wang和Luo(2023)的文献。该数据库中的结构响应数据是通过OpenSees(Mazzoni et al,2006)平台建立上述框架结构的有限元分析模型获得的。其中,框架梁和柱采用基于力插值函数的梁柱单元来模拟,截面混凝土采用Concrete02单轴材料模型,约束混凝土采用Mander模型,钢筋采用Hysteretic单轴材料模型。Hysteretic单轴材料模型不但能够考虑应力和应变的捏拢效应,还能考虑基于能量的强度退化效应以及基于延性的刚度退化效应(Mazzoni et al,2006)。通过调整Hysteretic模型中控制基于能量的强度退化参数D,可以准确反映强震作用下由于延性RC框架中框架柱产生较大的侧向变形使得纵筋发生屈曲,进而导致其出现强度退化现象。
在用于训练的样本数据集{xk,yk}Nk=1中,xk∈Rd为预测模型的输入变量,该变量由结构的设计参数以及地震动参数组成(表1); yk∈{1,-1}为结构的破坏状态组成的输出变量,当结构破坏状态为倒塌时,yk=1,未倒塌时,yk=-1。各输入变量的参数分布、输入变量与输出变量间的相关系数均在表1中列出。由表1可知,单一输入变量与输出变量之间的相关性不大,说明二变量之间的线性关系不成立,而利用机器学习方法建立二者之间的非线性映射关系更为合理。
由于原始数据集中的输出变量为最大层间位移角(连续型变量),而非RC框架结构的破坏状态(离散型变量),这使得原始数据集虽然适用于回归问题的求解,但是无法直接用于分类问题的求解,也就无法适用于本文的研究。为了解决这一问题,本文根据《建筑抗震设计规范》(GB 50011—2010),将最大层间位移角0.02 rad作为判定结构倒塌状态的阈值,该规范将0.02 rad的位移角定义为结构生命安全极限状态和塑性极限状态的参考点,广泛用于评估和设计类似的钢筋混凝土框架结构。考虑到规范的普遍适用性和在工程实践中的验证,本文将原始数据按照最大层间位移角是否超过0.02 rad作为分类依据,以此区分结构的倒塌和未倒塌状态,最终形成16 500组适用于解决分类问题的数据集,即{xk,yk }16500k=1。以六层RC框架为例,图2展示了数据集中RC框架结构在不同地震动强度(一阶自振周期对应的谱加速度Sa)作用下的倒塌和未倒塌两类状态的分布情况。
将数据集{xk,yk }16500k=1按7:3的比例随机划分成训练集与测试集,最终得到11 500个训练集样本和4 950个测试集样本。LS-SVM模型将对全部11 500个训练样本进行训练。分别从训练集中选取100,200,…,1 200组子样本代替全部的11 500个训练样本进行训练。图3a给出了EILS-SVM模型中预测准确率与子样本规模大小的关系。由图3a可知,随着子样本规模的增加,EILS-SVM预测准确率呈上升趋势,当子样本规模达到800时,曲线趋近平缓,当子样本规模达到800后,EILS-SVM预测准确率随着子样本规模的增加提升不大。而且,图3a说明了本文提出的EILS-SVM模型在训练集和测试集上的准确率高且差异不大,证明了本文采用的21个输入变量是合理的,可以使模型泛化性能好,且不会出现过拟合问题。由图3b可知,EILS-SVM的计算时间随着子样本规模的增大而不断增加。因此,当子样本规模为800时,EILS-SVM模型能在保证较高的预测准确率的同时确保较短的计算时间。
为了评估EILS-SVM模型的预测性能及泛化能力,笔者将其与其它5种传统的机器学习模型——最小二乘向量机(LS-SVM)、随机森林、神经网络、线性判别分析(LDA)和贝叶斯模型进行比较。EILS-SVM模型采用随机选取的800个子样本进行训练,而其它传统机器学习模型则采用全部11 500个样本进行训练,然后将训练后的不同的机器学习模型分别对测试集数据进行预测,以此对比不同机器学习模型的有效性和泛化能力。图4给出了使用EILS-SVM模型与使用其它5种模型预测得到的建筑物破坏状态的混淆矩阵。混淆矩阵是机器学习中用于评价分类精度的一种标准格式,它展示了真实分类结果与预测分类结果的关系。混淆矩阵的对角线上的元素代表了正确预测的样本数量,对角线外的元素代表了错误分类的样本数量。图中混淆矩阵右下角区域代表了预测准确率,两侧百分数区域分别代表精度与召回率。由图4和表2可知,EILS-SVM和LS-SVM模型的预测准确率明显优于其它4种机器学习模型。同时,尽管EILS-SVM使用了较少的800个子样本,其准确率仍与使用全部11 500个样本进行训练的LS-SVM相近,且用时仅为LS-SVM的1/27,说明EILS-SVM在处理大规模数据集时的有效性。
表2 EILS-SVM模型与其它5种传统机器学习模型性能指标对比
Tab.2 Comparison between the performance of EILS-SVM model and the performance of other 5 traditional machine learning models
为了展示EILS-SVM模型预测易损性曲线的能力,将6层RC框架(基本自振周期T1=1.07s)在不同退化参数(D=0.1、0.6和1.0)下对应的30条地震动记录及其调幅后共计900个样本作为测试集,剩余15 600个样本作为训练集,对比EILS-SVM模型和其它有限元方法生成的易损性曲线。
图5给出了EILS-SVM模型对不同强度退化参数下6层RC框架破坏状态的预测结果的混淆矩阵。从图中可以看出EILS-SVM模型预测结果的正确率均达到了97%以上。用MSA方法(Baker,2015)分别计算出EILS-SVM模型和有限元方法的易损性参数θ和σ(表3)。图6 分别给出了D=0.1、0.6和1.0时,通过EILS-SVM模型和有限元方法得到的易损性曲线。由图6可看出,用EILS-SVM模型与用有限元方法预测的易损性曲线基本重合,表明EILS-SVM模型能够准确预测RC框架的易损性曲线。
图5 基于EILS-SVM的6层RC框架在不同退化参数下结构破坏状态预测结果的混淆矩阵
Fig.5 Confusion matrix of the predicted results of the structural failure state of a six-storey RC frame based on EILS-SVM model according to different degradation parameters
图6 基于EILS-SVM的6层RC框架在不同退化参数下的易损性曲线预测结果
Fig.6 Predicted fragility curves of a 6-storey RC frame according to different degradation parameters based on EILS-SVM model
本文提出了特征向量信息支持向量机(EILS-SVM)模型,用于解决有限元方法计算结构易损性曲线时效率不高、大规模训练样本下传统的机器学习训练过程效率低下这两个问题,并以RC框架的破坏状态和易损性曲线预测为例,与传统机器学习分类算法进行对比,结论如下:
(1)EILS-SVM模型的预测性能和计算效率与所选样本子集规模有关,预测性能会随着子集规模的增大而提高,但计算效率则会相应降低。
(2)与LS-SVM模型相比,当子集规模为800时,EILS-SVM模型的预测性能与基于11 550个大规模训练样本的LS-SVM模型的预测性能相当,且远优于随机森林、神经网络、线性判别分析(LDA)和贝叶斯算法。并且EILS-SVM模型的计算时间相较于传统机器学习模型最高减少了27倍,显著提高了计算效率。
(3)EILS-SVM模型能够准确预测RC框架的易损性曲线,预测得到的易损性曲线与有限元方法生成的易损性曲线比较吻合。