基金项目:广东省自然科学基金(6021462)和广东省岩土工程重点学科基金联合资助.
(1.广东工业大学,广州 510006; 2.湖南省地质矿产勘查开发局407队,湖南怀化 418000; 3.中国科学院广州地球化学研究所,广州 510640)
(1. Guangdong University of Technology, Guangzhou 510006, Guangdong, China)(2. No.407 Brigade, Geology and Mineral Resources Exploration and Development Bureau of Hunan Province, Huaihua 418000, Hunan, China)(3. Guangzhou Institute of Geochemistry, Chinese Academy of Sciences, Guangzhou 510640, Guangdong, China)
rough set; support vector machine; attribute reduction; seismic damage prediction; conditional information entropy
备注
基金项目:广东省自然科学基金(6021462)和广东省岩土工程重点学科基金联合资助.
结合粗糙集理论的属性约简与支持向量机的分类功能,建立了基于粗糙集与支持向量机的建筑物震害预测模型。该模型首先运用粗糙集理论,建立决策表,进行属性离散、属性重要性排序、属性约简和分类规则的提取,然后用所提取的关键成分训练支持向量机。该模型不但能有效降低建筑物震害影响因子数据维数及支持向量机的复杂程度,提高训练速度和分类精度,而且还能对各因子的影响程度进行排序。最后,通过实例验证了该模型的性能。
A model for seismic damage prediction of building is proposed based on two integrated intelligent algorithms: attribute reduction algorithm of rough sets and support vector machines.At first, rough set theory is used to acquire the knowledge of classification, which includes decision table construction, attribute discretization, attribute importance ranking, attribute reduction and rule abstract. Then, the key components are extracted as the input of support vector machine. The method can reduce the dimensions of the data and the complexity, and raise the efficiency of training and the accuracy of prediction. The effect extent to the earthquake-resistance performance of these factors can be obtained in the model. Finally, it is validated applying the method to forecast seismic damage of multistory masonry buildings.
引言
地震对人类社会造成了重大的人员伤亡和巨大的经济损失。20世纪的100年间,我国共发生650余次6级以上的破坏性地震,死亡约59万人,全球死亡20万人以上的两次地震都发生在我国,2008年四川汶川8.0级地震撼动了大半个中国,伤亡十分惨重。据资料统计,我国有67%的大城市位于地震烈度Ⅶ度及以上的地震区,大部分地区受到地震灾害的威胁(尹之潜等,2003)。为了减轻地震灾害损失,许多专家学者在震害预测方面做了大量研究,提出了多种震害预测方法(刘恢先,1986; 阎维明,2006; 汤皓,2006; 赵艳林等,2002; 缪升等,2000),如历史地震统计法、半经验半理论法、模糊类比法、结构计算法等,近年来又出现了神经网络方法。建筑物震害一方面与地震特性相关,另一方面又与建筑结构特性有关。震害影响因素众多,而且各因素之间具有随机性、模糊性、不确定的相关性及统计资料的不完备性,因此,建筑物震害预测是一个高度复杂的非线性系统。
20世纪60~70年代,Vapnik(1993,1995,1998)等人开始致力于统计学习理论(Statistical Learning Theory, 简称SLT)的研究,并于90年代提出了支持向量机(Support Vector Machine, 简称SVM)。它能很好地解决小样本、非线性、高维数和局部极小等问题,并已成功地应用于函数模拟、模式识别和数据分类等领域,成为继经典神经网络研究之后的又一研究热点。1982年波兰科学家Pawlak提出的粗糙集理论(Rough Sets,简称RS)能较好地处理不准确或不完整知识信息及冗余信息(张文修,2001)。本文中笔者运用粗糙集理论对建筑物震害的影响因子进行约简,剔除了与决策信息不相关的(或影响甚微的)属性,进而简化SVM的输入变量,将两种算法有机地结合起来,建立了基于粗糙集—支持向量机的建筑物震害智能预测模型,然后通过实例验证了该模型的有效性。
1 粗糙集理论
粗糙集理论是分析不完整、不精确信息系统的有力工具。粗糙集方法把研究对象视为一个信息系统,通过不可分辨关系和不可分辨类确定问题的近似域。根据知识表达中不同属性的重要性,明确有用信息和冗余信息,简化输入信息的表达空间维数。在保持分类能力不变的前提下,通过知识约简,直接从训练数据中导出分类规则(张文修,2001)。
1.1 信息系统及条件信息熵一个信息系统可表示为
S=(U,R,V,f).(1)
其中,U为对象的非空有限集合, 即论域; R为属性的非空有限集合; V=∪r∈RVr,Vr为属性r的值域; f:U×R→V是一个信息函数, 指定U中各对象的属性唯一值。对信息系统S,若属性集R=C∪D,子集C和D分别称为条件属性集和决策属性集,C∩D≠φ,则该信息系统称为一个决策系统或决策表。
在粗糙集理论研究中,Duntsch等(1998)从信息论的角度,建立了知识与信息熵的关系,引入了信息熵和条件熵概念。信息熵是信源总体的平均不确定性的量度。定义知识(属性集合) P 的熵H(P)和知识(属性集合)Q相对于知识(属性集合)P的条件信息熵H(Q/P)为:
H(P)=-∑ni=1p(Xi)lgp(Xi),(2)
H(Q/P)=-∑ni=1p(X1)∑mj=1p(Yi/Xi)lgp(Yj/Xi).(3)
式中,P(Xi)为P在论域U上的划分X=(X1,X2,…,Xn)上的概率,P(Xi)=│Xi│/│U│,i=1,2,…n。条件概率p(Yj/Xi)=│Yj∩Xi│/│Xi│,i=1,2,…,n; j=1,2,…,m。
这样,就可以利用每个条件属性对决策属性的条件信息熵大小来判断该条件属性与决策属性的影响程度。由RS理论的信息论观点(阎维明,2006),设C是U的一个条件属性集, D是决策属性集,且C∩D≠φ,r∈C,则属性r是C相对于决策属性D不必要的充要条件是
H(D/C)=H(D/(C-{r})).(4)
C相对于决策属性D独立的充要条件是对于C中任意属性r都有
H(D/C)≠H(D/(C-{r})).(5)
1.2 基于条件信息熵的相对约简算法属性重要性是知识约简中的一个关键概念,设AC,则对于任意属性a∈(C-A)重要性
γ=SGF(a,A,D)=H(D/A)-H(D/A∪{a}).(6)
SGF(a,A,D)的值越大,说明在已知A的条件下,属性a对于决策D 就越重要。
在实际工作中,有些因素虽非绝对不必要,但它对结果的影响往往很小。本文结合震害预测的实际情况, 设δ为一个很小的数,当满足
γ=SGF(a,A,D)=H(D/A)-H(D/A∪{a})≤δ,(7)
该属性可相对约简。该算法的主要步骤如下:
(1)计算决策表中条件属性C和决策属性D的信息熵H(C)和H(D)。
(2)计算决策表中决策属性D相对于条件属性C的条件信息熵H(D/C)。
(3)给定一个较小的值δ,令B=C,对于条件属性集C中的任一属性CiC,重复以下计算过程:
① 计算决策属性集D相对于属性集(C-Ci )的条件熵H(D/(C-Ci)),即H(D/B-Ci));
② 计算Ci 的重要性γ=SGF(Ci,(B-Ci),D)=H(D/(B-Ci))-H(D/C);
③ 若γ=SGF(Ci,(B-Ci),D)=H(D/(B-Ci))-H(D/C)≤δ时,令B=C-Ci,重复(3),否则终止计算。
(4)得到B为C相对于D的近似相对约简。
2 支持向量机
支持向量机(SVM)是一种基于VC(Vapnik-Chervonenkis)理论的创造性机器学习方法,由Vapnik和他的合作者(1993)提出。SVM实现了结构风险最小化,同时还最小化了经验风险与VC维的界。分析问题时,设样本集{(xi,yi)}(i=1,2,…,m),其中,xi为输入向量,yi为目标输出向量,m为样本容量。大多数情况下输入与输出之间呈非线性关系,将样本x通过非线性映射φ(x)映射到高维特征空间(Hilbert空间),并在该空间进行线性回归,就可获得在原空间非线性回归的效果,其表达式为
f(x,w)=wφ(x)+b=(w,φ(x))+b.(8)
式中,w为权矢量,b为偏差,(w,φ(w))表示内积。SVM采用结构风险最小原理,其中风险用Vapnik提出的不敏感损失函数来度量。ε定义为
L(y-f(x),x)=│y-f(x)│ε={0, │y-f(x)│≤0
│y-f(x)│<ε, 其它(9)
为了确定系数w和b,考虑到允许误差的情况,引入松驰变量ξi≥0和ξ*i≥0,求解以下最小化问题
minφ(w,ξ,ξ*)=1/2‖w‖2+C∑ni=q(ξi+ξ*i).(10)
y1-wφ(xi)-b≤ε+ξi, ξ1≥0;
wφ(xi)+b-yi≤ε+ξ*i, ξ*i≥0.
式中,第一项为正规化项; 第二项为经验误差项; C为正规化常数,它确定了经验误差项与正规化项之间的某种平衡关系。SVM通过构造核函数K(xi·xj)来克服维数灾难。当函数满足Mercer条件时,某一映射空间的内积运算就存在K(xi·xj)=φ(xi)φ(xj),即线性问题的内积运算用核函数来代替,高维空间的内积运算就可通过输入空间的函数实现。运用对偶原理并引入拉格朗日乘子α和α*后,决策函数的形式为
f(x)=∑Ni=1(αi-α*i)K(xi,x)+b.(11)
这样(10)式最优化问题就转化为对偶问题:
maxW(α,α*)=-1/2∑ki=1∑kj=1(αi-α*i)(αj-α*j) K(xi,xi)+∑ki=1yi(αi-α*i)-ε∑ki=1(αi-α*i),(12)
∑mi=1(αi-α*i)=0, C≥αi≥0, i=1,2,…,n.
在(12)式中只有少数αi,α*i不为0,它们所对应的点为支持向量,回归函数f(x)可以由支持向量完全表征。其中K(xi·xj)为满足Mercer条件的内积函数,即核函数。常用的核函数有多项式核函数、Gauss函数、Sigmoid函数和径向基核函数。支持向量机法采用结构风险最小化原则,具有很好的推广能力,求解一个凸二次优化问题,就能保证找到全局最优解。
尽管SVM方法具有如前所述的优点,但亦存在一些不尽人意之处,如当处理的数据量过大时,冗余信息的存在使得SVM的训练时间过长、速度变慢。RS理论能很好地处理不准确或不完整知识信息及冗余信息。因此,可将两者有机结合起来,用于建筑物震害预测中。
3 基于粗糙集—支持向量机的建筑物震害预测模型
3.1 宏观震害经验及震害影响因子随着我国经济的飞速发展,近年来新建了大量高层建筑,但还存在一定比例老旧房屋和一些抗震性能较差的房屋,其中多层砖房问题尤为突出。笔者以多层砖房为研究对象,从狭义震害预测角度分析了建筑物的易损性,即对结构在确定的地震强度作用下,发生某种破坏程度的概率或可能性进行了预测。多层砖房在地震作用下,其破坏的部位、特点以及具体形态多种多样,但概括起来,可依据其破坏的程度将震害划分为5个等级(表1),大量的宏观震害经验表明,多层砖房的震害程度与下列因素密切相关。
(1)地震特性。在以往的研究中,通常采用烈度指标表示地震特性,而本文选取地面加速度峰值作为地震特性指标。震害经验表明,对于强震而言,地面运动力特别是地面运动水平加速度峰值是造成建筑物破坏的主要因素; 而且以峰值加速度和特征周期为参数的中国地震区划图已颁布实施。
(2)场地与地基条件。大量宏观震害资料表明,地震破坏程度不仅与地基有关,而且与建筑物的刚度有关。松软的地基上,地基的沉降会使其上部结构遭到局部破坏,而强烈振动是导致坚实地基上刚性建筑物破坏的主要原因。如果把刚性建筑物修建在松软地基上,则地基能吸收地震的部分能量,从而起到隔震的效果。在松软地基上的柔性房屋,其破坏原因是地震波产生低频率共振而造成的。由于地震重复性荷载的作用,地基因液化和强度骤然降低而失去稳定性,建筑物基础的竖向和水平位移以及地基的不均匀沉陷,往往是松软地基上建筑物遭受破坏的主要原因。一般说来,基岩上的地震烈度约比一般土层要低1度,而软弱土层上的地震烈度比一般土层要高近1度; 从水文地质方面来说,地下水浅的地区比地下水深的地区效应大,破坏重; 从地形地貌方面来说,地形地貌复杂的地区地震效应大,破坏严重(刘本玉,2001)。
(3)建筑物层数与层高。房屋的层数与层高不仅影响房屋的空间刚度,而且使房屋受到的地震力的大小亦大为不同,层数越多,层高越高,其震害就越重。
(4)房屋的整体性。在多层砖房中,水平承重构件为楼屋盖。历次震害表明,现浇钢筋混凝土、预制混凝土与木楼屋盖的地震表现是有差异的,其原因是现浇楼屋盖整体性最好,预制楼屋盖次之,而木盖最差。横墙承重或纵横墙承重的房屋比纵墙承重的房屋抗震能力要强; 用钢筋混凝土构造柱和圈梁来增强多层砖房的抗倒能力效果显著。
(5)建筑物体型。建筑体型对建筑结构的抗震性能有着显著的影响,当建筑体形不规则,墙体位置不均匀,建筑物刚度中心与荷载作用点有较大间距时,会产生扭转。当在水平地震力作用下剪切与扭转组合时,其所受应力加大,震害显著加重。特别是平面突出部分与主体中心部分震动不同步时破坏更明显。同样地,多层砖房在立面竖向的变化,即刚度在竖向的不均匀或突变也使震害更为严重。
(6)施工质量。施工质量对房屋抗震性能的影响是显而易见的。施工质量好、达到抗震设计标准的房屋抗震能力就好; 施工质量差的房屋其抗震性能必定不好。建筑年代的影响也需要综合考虑。
(7)含砖墙率。它表达了房屋的刚度、强度、空旷程度等特征。含砖墙率越大房屋的空间刚度越大,抗剪能力越强,震害就越轻。
(8)承重墙体砂浆标号。多层砖房的地震破坏主要是由于砖墙首先开裂,这是由砂浆强度较低造成的。
在用特征向量建立预测模型时,除了要考虑各因子对房屋结构的抗震性能的影响外,还需考虑参数的容易获取性和关联性(或独立性)。
3.2 基于粗糙集—支持向量机的震害预测模型基于粗糙集—支持向量机的震害预测模型由两部分构成(图1),预测模型将粗糙集网络作为前置系统,支持向量机作为后置的信息识别系统。首先运用粗糙集理论获取分类知识,建立决策表,进行属性离散化、属性重要性排序、属性约简和分类规则的提取; 然后用所提取的关键成分训练支持向量机。该方法可有效降低建筑物震害影响因素数据维数及支持向量机的复杂程度。通过粗糙集方法去掉冗余信息后,减少了信息表达的特征数量,而简化支持向量机的复杂程度,可缩短训练时间。支持向量机能很好地消除粗糙集对噪音敏感的缺陷,解决预测中的小样本、非线性、高维数和局部极小等问题。
3.3 实例及分析笔者收集了1966年云南东川地震、1978年唐山大地震、1988年云南澜沧—耿马地震、1995年云南武定地震和1997年云南丽江地震、2001年云南施甸地震、2007年云南保山隆阳地震中的多层砖房震害资料(刘恢先,1986,缪升等,2000,白良等,1989,汤皓,2006,非明伦,2002,2007),选择其中96个样本用于训练基于粗糙神经网络的多层砖房震害模型。
本文选择以下震害影响因子:房屋层数、房屋质量、砂浆标号、砖墙面积率、房屋整体性、场地条件、地震峰值加速度作为模型的输入。对于定性指标参考专家经验赋值。① 房屋质量:施工质量优取为10、中取8、差取6,同时考虑建筑年代进行房屋折旧,每5年减0.5; ② 房屋的整体性:楼盖和屋盖,现浇取5、预制取4、木屋盖取3,有圈梁加1、有构造柱再加1,有地下室、筏基加1,房屋开裂减1; ③ 场地条件:Ⅰ类场地取1、Ⅱ类取2、Ⅲ类取3、Ⅳ类取4。将给定地震下可能的建筑物的震害程度为模型的输出震害作为系统的最终输出,把震害程度划分为5级:基本完好、轻微破坏、中等破坏、严重破坏、毁坏,所收集的样本资料如表2(限于篇幅仅列出部分样本)。
震害预测信息系统S=(U,R,V,f)中,将研究区域内的全部建筑物组成的集合作为论域U={U1,U2,…,U96},震害影响因子作为条件属性C={c1,c2,c3,c4,c5,c6,c7},给定地震加速度峰值下建筑物可能的破坏程度为决策属性D={d1,d2,d3,d4,d5},其中d1=基本完好、d2=轻微破坏、d3=中等破坏、d4=严重破坏、d5=毁坏,属性集R=C∪D,C∩D≠φ。决策表的表头为各属性,其每一行表示论域中的一个事例或称一条决策规则,每一列表示属性及属性值。各因子变化范围及其离散化值如表3,按表3离散化后形成初始决策如表4。
利用本文前述的重要性概念,分别分析建筑震害影响因子(条件属性)的重要性。
(1)按决策属性D对U进行划分得:U/D={Y1,Y2,Y3,Y4,Y5},其中,Y1={U3,U8,…,U90}23, Y2={U4,U9,…,U96}31,…, Y5={U6,U11,…,U93}9,下标表示组中所含元素的个数。则可得p(Y1)=23/96, p(Y2)=31/96, …, p(Y5)=9/96。
(2)按条件属性C={c1,c2,c3,c4,c5,c6,c7}对U进行划分得U/C={Xi,X2,…,X81},可计算出X1={U1}1, X2={U2}2, …, X81={U81}81,则可得p(X1)=1/96, p(X2)=1/96, …, p(X81)=1/96。计算条件信息熵得H(D/C)=-∑81i=1p(Xi)∑5j=1p(Yi/Xi)lgp(Yj/Xi)=0。
(3)按式(8)计算各因子的重要性系数γi,得γ1=0.023, γ2=0.009, γ3=0.018, γ4=0.049, γ5=0.034, γ6=0.025, γ7=0.012 7,各因子的重要性排序为:γ7>γ4>γ5>γ6>γ1>γ3>γ2,若取ε=0.02,得该决策表的条件属性集C相对于D的一个近似相对简约B={C1,C4,C5,C6,C7}。
将经过条件信息熵简约后的5个关键特征因子{C1,C4,C5,C6,C7}作为支持向量机的输入向量,而以建筑物震害等级D作为输出。用对决策表进行约简后得到的规则作为样本数据进行训练。选择径向基函数作为核函数,即
K(x,xi)=exp(-│x-xi│2/σ2).(13)
式中,xi,xj为训练输入,σ为核函数宽度。
支持向量机的训练参数为σ和C。σ的大小影响样本的输出响应区间,当σ越小时,响应区间越窄,得到的分类面经验风险越小,表现为函数曲线光滑,但结构风险越大。惩罚因子C表征对错误的惩罚程度,C越大表示对错误分类的惩罚越大。我们通过试算,取σ=0.1,C=1 000。
为了验证模型的性能,另选7个样本进行测试,计算结果如表5所示,除6号样本的预测结果有偏差外,其余6个样本的计算结果与实测结果完全吻合。出现误判的原因可能是由于建模所采用的原始样本中缺乏与6号相近的样本。因此,选样本建模时要特别注意原始样本的代表性。
4 结论
(1)建立了基于粗糙集—支持向量机的建筑物震害预测模型,该模型综合了粗糙集理论在知识获取方面的能力和支持向量机很强的分类能力。降低了数据维数及支持向量机的复杂度,提高了训练速度和分类精度。实例研究表明,运用本模型对多层砖房的震害预测与实际震害基本吻合,明显提高了建筑物震害预测的可靠性。该模型不仅能预测震害,还能对各因子对建筑物抗震性能的影响程度进行排序,因此对建设工程抗震设计具有重要参考价值。
(2)震害预测工作涉及到前期大量数据的收集及后期的数据处理,将属性约简用于震害预测工作,将大大减少数据收集与处理的工作量。这一研究思路和方法同样适合于其它结构类型建筑物的震害预测。
- 白良.1989.澜沧—耿马地震多层砖房的震害及机理简析[J].云南工学院学报,4(3):35-43.
- 非明伦,崔建,文赵永.2002. 施甸地震震害分析[J]. 地震研究,192-199.
- 非明伦,周光全, 余庆坤, 等.2007.保山隆阳5.0级地震永昌城区房屋震害统计与分析[J].地震研究,30(1):77-82.
- 刘本玉, 江见鲸. 2001.多层砖房震害因子的选择及其与震害程度的灰色关联序分析[J]. 地震研究,151-156.
- 刘恢先.1986.唐山大地震震害[M].北京:地震出版社.
- 缪升,刘本玉,叶燎原. 2000.多层砖房震害预测的人工神经网络方法与实践[J].世界地震工程,16(1):21-27.
- 汤皓,陈国兴. 2006.基于BP神经网络模型的多层砖房震害预测方法[J].地震工程与工程振动,(4),141-146.
- 阎维明,乔亚玲,何浩祥.2006.粗糙集理论在震害预测中的应用[J].自然灾害学报,15(3):147-151.
- 尹之潜.1996.地震灾害及损失预测方法[M].北京:地震出版社.
- 尹之潜,赵直,杨淑文.2003. 建筑物易损性和地震损失与地震加速度谱值的关系(上)[J].地震工程与工程振动, 23(4):195-200.
- 张文修,吴伟志.2001.粗糙集理论与方法[M].北京:科学出版社.
- 赵艳林,杨绿峰.2002.多层砖房震害的灰色预测[J].世界地震工程,18(1):56-61.
- Duntsh L,Gediga G.1998.Uncertainty measures of rouhg set prediction[J].Artificial Intelligence,106:109-137.
- Pawlak Z.1982.Rough sets[J].International Journal of Information and Computer Science,11:341~356.
- Vapnik V N.1993.Three fundamental concepts of the capacity of learning machines[J].Physics(A),200:538~544.
- Vapnik V N.1995.The Nature of statistical learning theory[M].New York:Springer Verlag.
- Vapnik V N.1998.Statistical learning theory[M].New York:Wiley.