基金项目:国家科技支撑计划课题(2012BAK19B04)和中国地震局地震科技星火计划攻关项目(XH12029)联合资助.
(1.中国科技大学 地球和空间科学学院,安徽 合肥 230026; 2.山东省地震局,山东 济南 250014)
(1. School of Earth and Space Sciences,University of Science and Technology of China,Hefei 230026,Anhui,China)(2. Earthquake Administration of Shandong Province,Jinan 250014,Shandong,China)
genetic algorithm; velocity structure; initial parameter; earthquake automatic location
备注
基金项目:国家科技支撑计划课题(2012BAK19B04)和中国地震局地震科技星火计划攻关项目(XH12029)联合资助.
论述了地震定位系统中所涉及的台站记录震相数据的筛选、地壳速度结构及遗传算法初始化参数的选择等技术改进思路,结合山东数字化虚拟测震台网的实际记录,研究了不同的速度结构和不同的定位方法对定位精度的影响。结果 表明,选择遗传算法和华南速度模型,并合理选择震相数据,可保证利用较少的台站数据以较快的速度给出较高定位精度的地震基本参数。
We discuss the improvement ideas of earthquake location system which include screening of phase data recorded at stations,crustal velocity structure and initialization parameters selection of genetic algorithm,etc.. Combined with the actual recordings of Digital Virtual Seismometry Network in Shandong,we study the influence of different velocity structure models and various location methods on the earthquake location precision. The results show that combined with selecting reasonably phase data,based on velocity model in South China,we could rapidly get the higher precision earthquake basic parameters with data recorded by less station using genetic algorithm.
引言
数字地震观测技术的快速发展为提高地震台网信息处理能力和服务功能提供了先决条件(金星等,2007a; 曲均浩等,2010)。在数字地震台网的数据处理系统中,地震自动定位结果已成为一种常规产出(金星等,2007b),地震发生后能够快速准确、稳定可靠地测定地震三要素,是对地震速报提出的一项迫切要求。提高地震定位精度一直是地震学应用研究的重要课题之一,也是自动定位系统的技术难点之一,开展地震定位方法的研究对提高地震定位精度意义重大(赵仲和,2005)。
地震精确定位属于地球物理反演问题,该问题可归结为在离散的、有限的数学结构上,寻找一个满足给定约束条件并使其目标函数值达到最大或最小的解。一般来说,地球物理反演问题通常带有大量的局部极值点,往往是不可微的、不连续的、多微的、有约束条件的和高度非线性。因此,精确求解问题的全局最优解一般是不可能的,但可以通过不断提高台站观测密度和完善空间观测布局、最大程度地利用观测中的已知信息、尽可能减小人为观测误差、不断积累震例资料、不断修正和完善地壳速度模型、利用最优的非线性理论和方法得到最接近真实的解。因此,要始终把解决可能会导致地震定位误差的因素作为重点问题来考虑。归结起来,地震定位误差的来源有3项(蔡明军等,2004):一是直达 P波和 S波到时读取误差,二是模型误差,三是线性化误差(线性定位方法)或离散化误差(非线性定位方法)。
1 遗传算法基本理论
遗传算法(Genetic Algorithm,简称GA)是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,是一种能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程,从而得到最优解或准最优解的通用搜索算法,于20世纪80年代末和90年代初期兴起。
遗传算法用二进制数来表示问题的待求解,将二进制数串联在一起形成一个由0和1组成的字符串,其中把二进制数看作一个基因,把字符串看作一个染色体(个体),问题的解包含在一个字符串中(栾锡武,1997)。随机地生成包含有不同染色体的个体,由此生成一个种群。在种群的演化过程中,其中的个体根据目标函数的大小进行淘汰、保留。人为地保持种群的大小不变,保留下来的个体通过基因的遗传和变异而形成新的种群,如此反复,最终得到最优的种群。这个种群中字符串所代表的参数即为问题的解。最小化的遗传算法单个迭代过程要经过繁殖、交配和变异3个计算过程(周民都,张元生,1999)。
2 震相筛选
当地震事件触发时,每次获取的台站震相并非都是理想的数据,各个台站震相各异,参与定位的一组震相也并非都是相同的,因而必须对自动拾取的台站震相进行合理筛选。笔者主要考虑以下4种情况:(1)利用到时最早的第一个台站的2个震相和其余台站的Pg震相进行定位,要求记录的第一个台站有S波记录;(2)对到时最早的第一个台站记录的S波进行合理性检验和校正,要求到时最早的第二个台站识别到S波信息,利用到时最早的第一个台站两个震相和其余台站Pg震相进行定位;(3)对到时最早的第二个台站记录的S波进行合理性检验和校正,要求到时最早的第一个台站识别到S波信息,利用到时最早的第二个台站的两个震相和其余台站的Pg震相进行定位;(4)如果系统仅识别到Pg波到时,则单利用所有台站的Pg震相进行定位。当多种情况发生时,取其中残差最小的结果做为最终的定位结果。
假定系统自动识别的各台直达Pg震相是比较准确的,当Pg波到时最早的第一个台站记录的Sg-Pg大于第二个台站时,对第一个台站的Sg波到时TS1进行校正
TS1=P1+(S2-P2)+((P1-P2))/a.(1)
当Pg波到时最早的第二个台站记录的Sg波与第一个台站的Sg波到时之差太大时(超过理论值1.2倍),对第二个台站的Sg波到时TS2进行校正
TS2=TS1+((P2-P1)·(a+1))/a.(2)
在人机交互进行地震精定位过程中,首先利用所有震相数据参与定位,根据初始定位结果确定各台站震相走时差,然后排除走时差超过1倍的走时残差标准差的震相数据,再进行精定位。
平均残差计算公式为
η=∑stai=1(|obsi-cali|)/(sta×deltai),(3)
标准残差计算公式为
σ=(∑stai=1((|obsi-cali|/deltai-η)2)/(sta-1))1/2.(4)
式中,obsi为第i个台站的观测走时; cali为第i个台站的计算走时; sta为台站的总数; deltai表示地震距离第i个台站的震中距。
3 速度结构选择
地震精确定位解决的前提是得到所研究区域的三维速度结构,笔者根据前人对该区域地下速度结构的研究,汇总了4种速度结构(表1),建立了山东地区三维速度模型。具体思路如下:以(36.0°N,118.0°E)为坐标原点,坐标系由北—东—垂直(下)组成,在东西方向上分别垂直于南北方向,以交点距离坐标原点长度为-1 000.0,-600.0,-500.0,-400.0,-300.0,-200.0,-100.0,0.0,100.0,200.0,300.0,400.0,500.0,600.0和1 000.0 km的位置作为块体的边界; 在南北方向上分别垂直于东西方向,以交点距离坐标原点长度为-1 000.0,-600.0,-500.0,-400.0,-300.0,-200.0,-100.0,0.0,100.0,200.0,300.0,400.0,500.0,600.0和1 000.0 km的位置作为块体的边界。这样就把以(36.0°N,118.0°E)为中心,将包括山东地区在内的区域为(2 000×2 000)km2范围内的地壳划分为每层256个块体。在垂直方向上,根据地
选择山东地区2009年发生的336次地震的台站观测报告中Pg和Sg到时资料,分别选择不同的速度模型,应用遗传算法进行地震定位。按照间隔0.2统计分布频次,定位结果的残差分析分两种情况:第一种是统计所有台站的走时残差分布(图1),应用J-B模型、IASPI91模型、滕吉文修改模型和华南模型所得到的平均定位标准残差分别是0.89、0.95、0.81和0.64; 第二种是只统计参与定位台站的走时残差分布情况(图2),应用J-B模型、IASPI91模型、滕吉文修改模型、华南模型所得到的平均定位标准残差分别是0.66、0.73、0.61和0.46,以上结果都说明华南速度模型与山东地区真实的速度模型更为接近。
高星等(2005)通过对中国及邻近地区地壳结构的研究表明,华北、华东和华南地区地壳厚度变化平缓,绝大部分地区为30~35 km。蔡学林等(2007)认为,中国大陆的地壳结构类型分为克拉通型地壳、增厚型地壳和减薄型地壳,华南地块和华北地块同属减薄型地壳,而且华南地块和华北地块上、中、下地壳三层的平均厚度和速度比较接近。本研究中所采用的模型对比中,利用华南速度模型的定位误差最小,具有合理性。
4 地震定位参数选择
为了提高地震定位精度和计算速度,本文采用了一种利用走时残差和到时残差的绝对值极小值作为目标函数的方法,对遗传算法中的参数,
图1 基于不同模型得到的山东地区336次地震的定位残差分布(所有台站)(a)J-B模型;(b)IASPI91模型;(c)滕吉文模型; (d)华南速度模型
Fig.1 Location error distribution of 336 earthquakes occurred in Shandong based on different models(all the stations)(a)J-B model;(b)IASPI91 model;(c)Teng Ji-wen model;(d)velocity model in Southern China图2 基于不同模型得到的山东地区336次地震的定位残差分布(参与定位台站)(a)J-B模型;(b)IASPI91模型;(c)滕吉文模型; (d)华南速度模型
Fig.2 Location error distribution of 336 earthquakes occurred in Shandong based on different models (station involved in positioning)(a)J-B model;(b)IASPI91 model;(c)Teng Ji-wen如各种适应度函数、变异概率进行了对比分析,同时考虑了地震定位计算中的一些约束条件。
4.1 目标函数选择遗传算法在地震定位过程所用到的目标函数为
φ(k)=∑mi=1(Oi(k)-Ti(k))2,
i=1,2,…M; k=1,2,…Q.
(5)
式中,M表示未知变量; Q表示种群个数。应用理论到时和观测到时差的平方和作为判断误差的标准。
地震定位会受到发震时刻与震源深度间强烈的折中关系及反演问题的非线性影响,为从根本上解决该问题,根据高星等(2002)的研究结果,笔者采用种利用走时残差和到时残差的绝对值极小值作为目标函数的方法,基本函数表示为
E(r,T0)=E1(r,T0)+E2(r).(6)
式中,E(r,T0)就是传统所选的目标函数,可具体表示为
E1(r,T0)=∑Nj=1|Wjdtj|p.(7)
式中,dtj=(Tj-T0)-τj(r)。其中,Tj是第j个地震台站P波至到时; T0为发震时刻; τj(r)表示假定地震震源位于r时的理论走时; N为台站总数; Wj为加权因子; p一般取2。
E2(r)函数可表示为
E2(r)=∑N2|Wj[(Tj-T1)-(τ1(r))]|p.(8)
式中,T、τ下脚标1表示P波到时最小时所对应的台站。可见,E2(r)与发震时刻无关。
定位问题中采用的目标函数E(r,T0)的优点在于发震时间与震源深度之间折中关系对定位结果的影响被减弱了。
4.2 适应度函数选择最常用的适应度函数有3种,第一种是用线性函数表示为
Pr=a-bφk.(9)
式中,b=Q-1(φmax-φavg)-1,a≥b·φmax.
第二种用幂函数表示为
Pr=φck.(10)
式中,c=1.005.
第三种用指数函数来表示为
Pr=Aexp(-Bφk).(11)
式中,B=(φQ)-1, A=[∑Miexp(-Bφi)]-1.其中,φmax、φavg和φσ分别是目标函数的最大值、平均值和标准差。据系数Pr的大小,采用轮盘赌的概率选择方法,选择Q个个体组成新的种群,就完成了繁殖过程。
选取合适的适应度定标方案非常重要。在一般情况下,模型是由多个参数组成的。先将模型的每一参数编成一个二进制子串(基因),然后将这些子串串联成一个二进制串(染色体)。
经过对比筛选,本文选择线性适应度函数来实现遗传算法中的个体选择。函数为
f(k)=φmax-Q-1(φmax-φavg)-1φ(k).(12)
其中,Q为种群个数; φmax、φavg和φσ分别是目标函数φ的最大值、平均值和标准差。
4.3 变异概率选择遗传算法的变异概率是改善遗传算法收敛情况的一个重要因素。由于变异只是遗传算法收敛过程中的一个小扰动,Sambridge和Gallagher(1993)提出了在基因的各个位分配不同的变异概率,高位码的变化导致参数变化较大,应分配较小的变异概率,低位码则应分配较大的变异概率。在遗传算法的初始阶段应在较大参数空间内搜索,可给以较大的变异概率,而在遗传算法的最后阶段己找到全局较优解,可给以较小的变异概率。根据这一思路,万永革等(1997a,b)给出了按迭代次数线性或指数下降的变异概率。结果表明,根据随迭代次数线性变化的变异概率比Sambridge和Gallagher(1993)采用按码位线性变化变异概率所得到的最小拟合差下降曲线的更平稳。随迭代次数指数变化的变异概率的最小拟合差在开始阶段和后面的阶段得到的最优解都比Sambridge和Gallagher(1993)采用按码位指数变化变异概率有所改善。平均拟合差在初始阶段的下降不如按码位指数变化变异概率,但在最后阶段比按码位指数变化变异概率的收敛情况要好。
设变异概率用Pm表示,变异概率初值用Pms表示,变异概率终值用Pme表示,迭代次数用n表示,最大迭代次数用N表示,则按迭代次数计算的线性变异概率表示为
Pm(n)=Pms-n*(Pms-Pme)/N.(13)
指数变异概率表示为
Pm(n)=exp(lnePms-n*(lnePms-lnePme)/N.(14)
按码位计算线性变异概率和指数变异概率时只是将迭代次数用n和最大迭代次数N分别用码位更换即可。
本系统采用的交配概率Pc=0.9; 变异概率按码位线性衰减变化,变异概率Pm的变化范围为0.1→0.001,即Pms=0.1,Pme=0.001。最大迭代次数为200次左右。
4.4 定位参数的初始选择地震发生的最大经度范围是110.0°~125.0°E,搜索步长因子是1/212; 最大纬度范围是30.0°~42.0°N,搜索步长因子是1/212; 最大震源深度范围为0~20 km,搜索步长因子是1/211; 发震时间的最大范围为0~50 s(相对于第一个台站P波到时),搜索步长因子是1/211。台站和地震地理坐标与直角坐标变换的参考点为(36°N,118°E)。
当地震事件触发报警后,要对定位参数范围做进一步约束,地震初始震中位置选定为第一个台站的经纬度位置(Lat1,Lon1),纬度变化范围为
Lat∈[Lat1-1.2·Vφ(S^--P^-),Lat1+1.2Vφ(S^--P^-)].(15)
经度变化范围为
Lon∈[Lon1-1.2·Vφ(S^--P^-),Lon1+1.2Vφ(S^--P^-)].(16)
地震发震时刻(相对于第一个台站的P^-到时)的初值采用以下方法得到:
T=a(S^--P^-).(17)
式中,S^-、P^-表示第一个台站的直达波到时,a=Vφ/VP^-(Vφ表示虚波速度,VP^-表示平均速度),发震时刻的初始变化范围限制在0.8T~1.2T之间。
当触发报警的台站记录震相缺乏S^-波震相时,则根据震中近似位于以两个台站为焦点的双曲线上的规律,利用前三个台站P^-到时初步确定震中位置。若3个台站两两相交的双曲线交点集中于1个点时,即(Elat,Elon),则纬度变化范围设定为Lat∈[Elat-0.5,Elat+0.5],经度变化范围为Lat∈[Elon-0.5,Elon+0.5]。若3个台站两两相交的双曲线交点集中于多个点或无交点时,则从P^-波到时最先到达的前4个或5个台站中选取空间分布线性度最差的3个台站再按照上述方法初步确定震中位置。若任何3个台站的组合都出现双曲线交点集中于多个点或无交点时,则纬度变化范围设定为Lat∈[Elat-3,Elat+3],经度变化范围为Lat∈[Elon-3.5,Elon+3]。
5 结果分析
单纯型法是寻优算法的一种,该方法是在n维空间中,用(n+1)个顶点构成一个多面体。依据单纯型运算规则,计算各顶点的函数值,然后进行比较,确定顶点的优劣; 再次计算新点,用好的顶点代替差的顶点,这样不断地改变顶点,使单纯型朝着目标函数最小方向移动,最终获得准确解。
目前山东省数字地震台网使用由广东省地震局研发的JOPENS系统进行地震速报,其中包含有单纯型搜索方法、HYPO2000、Hyposat等定位方法,初步研究表明,单纯型搜索方法是区域地震定位精度较高的方法(石玉燕等,2008; 陈贵美等,2009)。
图3给出了由JOPENS系统中单纯型搜索方法所得到的山东地区336次地震的定位标准残差分布。336次地震标准差的平均值为0.60。由图1,2与图3分别进行比较可知,本项目开发的遗传算法与单纯型搜索方法的地震定位效果相当。应用上述两种方法所确定的地震定位深度有较大差异(图4),由单纯型搜索方法得到的震源深度集中于5~10 km范围内,平均深度7.7 km(图4a),而由遗传算法得到的震源深度范围较大,平均深度14.2 km(图4b)。
图3 基于华南速度模型应用单纯型搜索方法得到的山东地区336次地震的定位残差分布(所有台站)
Fig.3 Using simplex search method to get the location error distribution of 336 earthquakes occurred in Shandong based on velocity model in Southern China(all the stations)6 结论
(1)本文提出了遗传算法中目标函数、适应度函数和变异概率选择的技术改进思路,还提出了地震自动定位中所使用震相的原则、震相筛选方法。
(2)选择遗传算法和4种速度模型分别进行了地震定位,结果表明华南速度模型更适于描述山东地区地壳速度结构。
(3)利用华南速度模型,选择遗传算法和单纯型搜索方法分别进行地震定位,结果表明两种方法的震中定位精度相当,但地震定位深度有较大差异,由单纯型搜索方法得到的震源深度集中于5~10 km范围内,平均深度7.7 km,而由遗传算法得到的震源深度范围较大,平均深度14.2 km。
(4)由于本文定位方法使用S波震相较少,因此在地震自动定位系统中有应用前景。另外,本文的研究仅表明和J-B速度模型、IASPI91速度模型和有关专家对华北地区的速度模型结果相比,华南地区的速度模型更接近山东地区真实的速度模型,要真正得到山东地区的速度结构还需结合本地的地震观测报告和波形记录进行详细研究。
- 蔡明军,山秀明,徐彦,等.2004.从误差观点综述分析地震定位方法[J].地震研究,27(4):314-17.
- 蔡学林,朱介寿,曹家敏,等.2007.中国大陆及邻区岩石圈地壳三维结构与动力学型式[J].中国地质,34(4):543-557.
- 陈贵美,杨选,刘锦.2009.广东数字地震台网‘十五'系统的几种地震定位方法的定位效果分析[J].华南地震,29(1):69-78.
- 范玉兰,林纪曾.1990.华南地区近震走时表的研制[J].华南地震,10(2):1-16.
- 高星,王卫民,姚振兴.2002.用于地震定位的SAMS方法[J].地球物理学报,45(4):525-532.
- 高星,王卫民,姚振兴.2005.中国及邻近地区地壳结构[J].地球物理学报,48(3):591-601.
- 金星,陈绯雯,廖诗荣.2007a.区域数字地震台网实时速报系统试运行情况分析[J].地震地磁观测与研究,28(2):50-54.
- 金星,杨文东,李山有,等.2007b.一种新地震定位方法研究[J].地震工程与工程震动,27(2):20-25.
- 栾锡武.1997.遗传算法及其在地震定位中的应用[J].海洋科学,(6):65-67.
- 曲均浩,刘希强,石玉燕,等.2010.地震事件自动判断方法研究[J].西北地震学报,32(4):325-329.
- 石玉燕,颜启,胡旭辉,等.2008.山东地震台网“十五”与“九五”期间地震定位方法对比研究[J].地震地磁观测与研究,29(3):46-50.
- 万永革,李鸿吉.1996.京津唐张地区速度结构和震源位置联合反演的遗传算法[J].地震地磁观测与研究,17(3):57-66.
- 万永革,李清河,李鸿吉,等.1997a.用遗传算法确定三维横向不均匀介质中的近震震源位置[J].西北地震学报,19(2):7-14.
- 万永革,刘瑞丰,李鸿吉.1997b.用遗传算法反演京津唐张地区的三维地壳结构和震源位置[J].地震学报,19(6):623-633.
- 赵仲和.2005.地震自动定位的综合解决方案[J].地震地磁观测与研究,26(1):50-56.
- 周民都,张元生.1999.遗传算法在地震定位中的应用[J].西北地震科学,21(2):167-171.
- Sambridge M S,Gallagher K L.1993.Earthquake hypocenter location using genetic algorithms[J].BSSA,83(5):1 467-1 491.