基金项目:国家自然科学基金联合基金(U2039205); 国家重点研发计划(2018YFE0109700).
第一作者简介:余怀忠(1975-),研究员,主要从事地震孕育机理和预测理论研究.E-mail:yuhz750216@sina.com.
(中国地震台网中心,北京 100045)
(China Earthquake Networks Center,Beijing 100045,China)
CSEP testing center; prediction modules; testing modules; integrated functionality; openness
DOI: 10.20015/j.cnki.ISSN1000-0666.2025.0019
中国的地震预报工作始于1966年邢台地震后,通过多年的努力,我国地震工作者已经在监测站网建设、前兆资料积累、预测经验获取、预报理论探索、预报工作机制建设等方面取得了显著成效。地震前兆观测从定时观测、模拟记录方式发展成数字化、网络化实时传输的时间数据加密; 从零星散点式观测发展为规模性区域成网观测的空间数据加密。在1975年辽宁海城7.3级、2017年新疆精河6.6级、2022年青海门源6.9级和2022年四川泸定6.8级等地震前均作出了有减灾实效的工作。然而,我国还没有建立科学的地震预报方法体系,制约了我国地震预报工作的推进。
我国大陆地区有超过4 000个台站开展地震连续观测,观测资料包括地震目录、全球导航卫星系统(GNSS)、地表形变、重力、地磁、地电、水文地质和地球化学等。科研人员基于海量的观测资料发展了上千种地震预测模型、方法(Yu et al,2022),如强震破裂空段(邵志刚等,2022)、断层运动闭锁段(Zhao et al,2022)、库仑应力增强区(程佳等,2018)和活动断层的中小地震稀疏段(王未来等,2021),以及视应力(陈丽娟等,2022)、b值(高雅婧等,2022)、加卸载响应比(Yu et al,2021)、多方法组合(Yu et al,2013)、地震发生率指数(Yu et al,2024)、地震综合概率(王芃等,2022)、地震空区(李兵等,2022)、地震条带(马茹莹等,2021)、GNSS观测的地壳变形和滑动亏损(Wu et al,2011; Zhao et al,2022)等。大量新数据的获得,不断丰富地震学家对地震孕育过程的认知,也为地震预报带来了新的机会和挑战。近年来的地震预测研究实践发现,形成科学预报方法体系的关键在于评价标准体系的建立(Yu et al,2022)。如果能够通过对预测方法的科学评价强化地震预报的基础,极有可能促进地震预报能力和水平的提升。
美国南加州地震中心2006年发起的“地震可预测性合作研究”(Collaboratory for the Study of Earthquake Predictability,CSEP)计划是全球最具代表性的地震预测研究(Jordan et al,2006,2010)。其目的是建立全球参与的、以发展向前和回溯不同时间尺度地震预测模型为目标的地震预测检验中心。美国南加州地震中心、意大利INGV、新西兰GNS Science、苏黎世联邦理工学院ETH Zurich等投入“竞技”的统计预测模型已超过几百个,可用于1 d、1 a和5 a等多个时间尺度预测(Schorlemmer et al,2018)。基于CSEP计划产出了N-检验、T-检验、ROC-检验、Molchan检验、L(似然)-检验、ASS-检验、LW-检验、RT-检验和RP-检验等一系列评价方法(Schorlemmer et al,2007)。其中,Molchan检验是国际上比较通用的一种评价方法。
依托国家重点研发计划“中国地震科学实验场的地震可预测性国际合作研究”,与全球CSEP计划深度合作,建设中国CSEP检验中心,引进吸收国内外先进经验,提升我国地震预测能力和社会公共安全的服务能力。目前已经吸纳了b值、态矢量(Yu et al,2013)、地壳共振(Chen et al,2020)等10余种预测方法,实现10 a、5 a、1 a、6个月、3个月、1个月、5 d、1 d等不同时间尺度参数模型的计算,以及Molchan检验、R值评分(许绍爕,1989)、N-检验和ROC-检验等国际认可的地震预报效能评价方法。相关研究成果已经应用到中国地震局的年度危险区预测工作中。在中国大陆2022和2023年度危险区确定过程中,地震学家加强了中国CSEP检验中心的应用,强化预测方法的评价和综合概率分析,提升了年度预测的效果。
为了进一步提升中国CSEP检验中心的影响,推进相关地震预测方法的应用,本文围绕预测模块和检验模块的搭建和使用,介绍了中国CSEP检验中心的软件系统建设情况。
2006年美国南加州地震中心发起的全球CSEP计划,鼓励发展多种地震预测模型,采用向前地震预测、可比较的数据、统一的计算规则和严格的统计检验等方式开展国际合作研究,通过对模型的严格统计检验与评估,提高对地震的可预测性的认识。目前该研究计划已在美国、新西兰、日本、欧洲等地建立CSEP检验中心,在模型构建和向前预测检验等方面取得大量成果,代表了当前的地震预测科技发展水平,对我国当前的地震预测预报工作具有重要的参考价值。我国有必要加强与CSEP的国际合作,并以中国国家地震科学实验场为平台,引进吸收国际先进经验,迅速提升我国地震预测能力和国际影响力,提高社会公共安全的服务能力。
CSEP 1.0计划实施了10年,取得了丰硕成果。2018年SCEC学术年会CSEP专题研讨会,决定于2019年启动CSEP 2.0计划,整合已有的CSEP检验中心,进一步推进地震预测国际合作。我国地震学者在CSEP 1.0阶段开展了一些预研工作,学习引进了图像信息(Pattern Informatics,PI)、传染型余震序列(Epidemic-Type Aftershock Sequence,ETAS)等模型,发表了一系列研究成果。在CSEP 2.0启动之际,我国地震学者尝试进一步开展合作研究,建立中国CSEP检验中心。
中国CSEP检验中心将通过建立地震预测方法的标准化评价体系,梳理现有的地震预测方法,并实现其应用的规范化。中心采用预测分析、效能检验和检验报告产出一体化的工作思路,定期更新各算法模块的基础数据,包括地震目录、断层、地壳形变、地下流体、地震波形、电磁等,其中地震目录已经实现准实时更新。既可以实现回顾性预测检验,也实现了向前预测功能(图1)。
中心的软件和功能模块基于B/S架构搭建,采用java spring boot框架,核心模块采用Python 等科学编程语言开发,支持Linux 64位操作系统,支持关系型数据库,如oracle、mysql等。Web服务:Tomcat7.0及以上。软件系统支持在实体服务器、云平台或虚拟机环境下部署和运行,在地震行业网内部署。同时,支撑并发量较大业务场景的要求,确保系统具有良好的弹性伸缩能力。
浏览器兼容性强,支持包括Edge、火狐、谷歌、QQ浏览器等的当前流行版本。系统具有良好的扩展性,支持模块化功能扩充,如新的数据质量控制指标、数据产品、定位算法等,能快速与现有系统集成。主要业务要求包括算法模块开发、综合数据处理系统、门户网站、信息服务系统4大部分。实现预测模块与检验模块的对接、检验结果与产出报告的对接、计算数据的读取和调用、定时更新、计算结果入库、检测报告入库等功能。其核心是综合数据处理系统,主要包括预测模块和检验模块的集成。
目前,平台已经集成了加卸载响应比(Load/Unload Response Ratio,LURR)地壳振动、态矢量、b值、地震发生率指数、小震调制比、地震综合概率、图像信息(PI)、相对强度(Relative Intensity,RI)、ETAS共10个预测模块。
选择上述10种预测模块的原因有4个:一是这些模块所涉及的方法具有一定的影响,有关研究成果已在国内外核心期刊上发表,已经有较为成熟的、公开的代码,便于成果的共享,也便于用户理解和应用。二是这些方法分别具有不同的优势预测时间尺度,比如PI方法为数年至数十年,LURR方法是数年至数月,态矢量方法为1 a左右甚至更短,地壳振动方法则为震前数月至数天,这些方法能够基本实现预测时间尺度上的互补,捕捉不同孕震阶段的异常特征。三是既有传统方法的继承和发展,又具有新方法的创新,LURR方法、b值、小震调制比是前人总结出来预测效能较好的方法,而态矢量、地震发生率、地壳振动、地震综合概率预测则是近年来提出的新预测方法。四是实现自主研发和国际流行方法的结合,LURR、态矢量、b值、小震调制比、地震发生率指数、地壳振动、地震综合概率是我国自主研发的预测方法,而PI、RI、ETAS则是国际流行的地震预测方法,通过相互比对和印证,加深我国与国际地震预测研究的接轨,推进我国的地震预报发展。
LURR方法是通过潮汐应力在某一时刻在断层面上引起的库仑应力的增加和减少,判断加载和卸载,使用地震目录计算加卸载响应比值,预测地震迫近程度(尹祥础等,1994)。当系统处于稳态时,加载响应与卸载响应相当,因而LURR=1; 当系统偏离稳态时,加载响应大于卸载响应,LURR>1。
依据 LURR的计算规则,编制完成可在Linux下运行的LURR模块(图2)Python程序。以地震目录为基础,利用LURR方法可执行程序,产出LURR时序曲线和异常的空间分布。可实现未来数天、数周、数月和数年多时间尺度的地震预测。
Chen 等(2020)在国内外多个强震前,通过地震仪资料和GPS资料,发现地壳振动信号在特定频段出现显著增强的现象(图3a)。图3b中,红色为异常时段的分析结果,即震前5~10 d的频谱,蓝色为背景时段的分析结果,即震前2个月的频谱。由图可见,在10-5~10-4 Hz的频带范围内,震前5~10 d振幅比背景振幅明显增强(于晨等,2021)。
本模块以识别0.2 Hz、0.05 Hz和0.0 001 Hz 3个频段(可根据实际应用情况进行调节)地壳振动信号为目的进行开发,当增强幅度超过背景值20%时,则认为记录到地壳振动信号。采用Tanimoto等(2006)提出的单台连续波形地震信号源定位法,通过对多个台站的单台法定位结果综合分析,判定地震发生位置。将水平方向的2个信号投射到正交轴上,并按照顺时针旋转叠加,确定最大振幅对应的方向为信号源方位。以信号源方向为中心,构造角度为30°、半径为300 km的扇形区域中,当至少3个台站出现重叠区域时,该区域为潜在的地震源(图3c)。
按照上述思路,通过设定背景观测时段和变化时段,产出异常分布图和异常来源分布图。目前该模型已经实现川滇地区地震危险性的实时跟踪。
态矢量概念来源于统计物理学,是一种对连续场进行粗粒化描述的方法。尹祥础等(2004)引入态矢量方法对1976 年唐山大地震、1975年海城大地震等进行了研究,发现大地震前态矢量参数有显著的变化,因而认为态矢量的特征变化可能是一种地震前兆。
将研究区域剖分成n个子区域(图4),通过子区域内小震活动在一定时期内的变化预测地震。具体方法为:将子区域i内对应的地震活动参量Vi看做n维矢量的一个分量,可以得到任意t时刻的n维态矢量:
Vt=[v1(t),v2(t),…,vn(t)] (1)
其增量为:
ΔVt-Δt,t=Vt-Vt-Δt (2)
分别计算态矢量的模:
M=|Vt| (3)
Vt-Δt和V之间的夹角为:
增量的模为:
ΔM=|ΔVt-Δt,t|(5)
态矢量Vt与单位矢量Ve之间的转角关系如下:
式中:单位矢量Ve表示各个分量相同的矢量。
本模块以地震目录数据为基础,产出态矢量时序曲线和对应数据。可实现未来数天、数周、数月和数年多时间尺度的地震预测。
地震综合概率模块是为了整合各种预测方法的预测结论,以风险概率的形式给出危险区域的空间分布和危险程度,推进地震综合预报由定性预报向定量预报的转变。它兼顾地震背景发生概率和每种预测方法的历史预测效能,采用贝叶斯公式计算综合概率(Field,2007):
P=1-(1-P1)(1-P2)(1-P3)… (7)
式中:P为综合概率; P1、P2、P3…为通过不同方法计算得到的对同一地点的地震概率。
在实际预测时,将各种方法评价所得的R值评分作为权重,综合概率P可改写为:
式中:N表示所选用的预测方法的个数; Ri是第i种方法的R值; c定义为:
式中: 是平均概率;
是平均R值。
本模块以地震目录和各种算法的预测结果为输入,能够产出地震综合概率预测分布图和对应网格概率值,实现不同时间尺度的向前地震预测功能。
按照PI方法(Rundle et al,2003),地震活动可以作为受稳恒速度连续驱动的阈值系统,系统中的能量耗散在长期平均的意义上接近稳定。PI算法假定中小地震活动异常是中等以上地震的前兆现象,考虑地震活动的增强与平静。具体步骤为:①对研究区进行空间网格划分,以落入每一网格中的地震事件个数构建时间序列; ②给定滑动时间窗,通过时空变化计算每个网格未来发生显著地震的可能概率,再减去地震背景概率,将发震概率高的网格以深浅不一的暖色块的形式呈现出来,即热点分布图。
PI方法使用Matlab语言编写,可在Linux下运行。以地震目录为输入数据,产出图像信息空间分布图,实现未来数天、数周、数月和数年多时间尺度的地震预测。
ETAS模型描述了地震活动时空丛集的自激发点过程(蒋长胜,庄建仓,2010),可以应用于研究区域地震活动时空特征和余震活动特征分析。
按照ETAS模型,每次地震都会触发余震且余震活动在时间域内遵循Omori-Utsu公式,单位时间t内的余震发生次数为:
ni(t)=Kexp[α(Mi-MC)]/(t-ti+c)p (10)
式中:MC为下限震级; Mi、ti分别为第i次地震的震级和发震时刻; K、α、c、p是常量。t时刻的地震发生率为:
本模块输入的是地震目录数据,可以产出未来一定时间、空间、震级窗内的预测结果。
RI是基于统计学原理构造的地震预测模型,通过学习历史地震数据,预测未来将要发生的给定震级范围内的地震次数。将研究区域按经纬度划分为规则网格,以网格为单位统计给定震级条件下的历史地震次数,根据已发生的地震次数预测未来地震的发生次数,最后累加得到研究区域的预测值(Rundle et al,2000)。通过遍历搜索适应研究区地震活动特征的最优模型参数,进行地震危险性预测,绘制RI预测热点分布图。
本模块以地震目录数据为输入,产出RI热点空间分布图,可实现未来数天、数周、数月和数年多时间尺度的地震预测。
SRI基于统计学模型,定量识别地震活动显著增强与减弱两种典型异常。计算方法为:分别给定背景时段:Tb=t2-t0,研究时段:Tw=t2-t1。根据背景时段Tb内发生的地震个数N,给定Tw时间内的平均地震发生率:
根据泊松分布,Tw时间内发生k次地震的概率为:
根据Tw内实际发生的地震数n,定义地震发生率指数SRI为:
本模块以地震目录数据为输入,可以产出未来数天、数周、数月和数年SRI预测的异常空间分布图。
根据Gutenberg-Richter定律,b值大小与应力水平呈反比,可以用来指示区域地震危险性水平,且一般选取低b值区域作为发生地震的危险区域(易桂喜等,2008)。
b值用最大似然法估算为:
式中: 为计算选用目录的平均震级; MC为地震目录的最小完备震级; dM为地震记录的最小标度,一般为0.1,通常地震总数N大于30。
在实际预测中,对研究区域进行网格划分,然后依次以各个网格节点为中心,筛选给定边长的区域内、给定时段内的地震目录,计算各节点处的b值。本模块以地震目录数据为输入,可以产出不同时段b值异常的预测结果。
小震调制比是地震学预测中的常用方法之一。当构造应力接近临界状态时,地震活动会受到固体潮调制(韩颜颜等,2017)。
本模块首先将研究区域进行网格化,依次以各个网格节点为中心,筛选一定半径、时段内的地震目录,按照农历初一和初二(朔),初七至初九(上弦),十五至十七(望),廿二至廿五(下弦)作为调制时间,计算相应节点的调制比,产出不同时段小震调制比异常的空间分布图。
中国CSEP检验中心软件系统集成了Molchan、R值评分、N值和ROC预测效能检验模型,对各种方法的预测效能进行评价。依据预测效能检验模块的要求,对每个效能检验和预测模块指定标准数据接口,按照效能检验算法的输入要求,完成预测和检验两大模块的对接,并制定容错机制保证程序模块的实时调用。
选择上述4种预测效能检验模型的主要原因包括2个方面:一是要能够对检验中心运行的各种预测模型进行检验,二是要能够对目前主流的预测方法进行检验。当然,随着未来平台预测功能模块的发展,中心软件系统必然会引入更多的检验模型完善检验功能模块。检验功能模块的集成首先要与预测功能模块对接,以各种预测模型的输出结果为输入,落实各种检验方法的功能,并能够动态链接地震目录数据库,实现对预测结果的评价。
R值评分是我国地震工作者普遍使用的地震预报效能评价方法(许绍燮,1989; Yu et al,2022),
计算公式为:
式中:SP和ST分别表示预测区域面积和整个研究区域面积; H和N分别表示一定时间窗内命中的地震数和地震总数。
当R>0时,表示预报有效,且R值越大效果越好,最大值为1; R=0表示预报无意义; R<0表示预报无效。结合统计分布检验,利用报准、漏报地震的个数,可以计算出大于97.5%置信度的临界值R0,当R>R0时,其预测的有效性高于自然发生概率,该预测结果具有较高的效能(图5a)。
R值评分类似于Molchan图表法的一种特例,表达为:
L=1-τ-ν (17)
式中:τ和n分别表示误报率和漏报率。
对于空间占有的预测方法,异常识别阈值降低,预测区域面积增大,同时命中率增加,其变化即Molchan曲线(Molchan et al,2008)。如图5b所示,图中任意点P0(τ0,m0),由于其与直线τ+m-1=0,即直线R=0的距离,结合R值计算公式可推导出,Molchan图表中每个点与直线τ+m-1=0的距离D与R值评分成正比,二者可以相互转换。以直线τ+m-1=0为分界线,其左下方区域的R>0,右上方区域的R<0。
假设地震的发生是相互独立的,一定时段内发生的地震个数符合n重伯努利分布(泊松分布的离散化表达),该时段内单个地震的发生概率用预测区域的空间占有率表示,相应的显著性水平满足以下公式:
式中:N表示地震总数; H表示报准地震的个数; α表示置信度。例如取α=5%,根据τ值反算伯努利分布下的报准率h,进而得出Molchan图表的显著性曲线。该方法还定义了概率增益参数(Zechar,Jordan,2008):
N-test是以目标地震数目与实发地震数是否一致的统计检验方法(Schorlemmer et al,2007)。根据泊松分布、泊松累积分布函数,即发生不超过ω个事件的概率,可表示为:
使用评分变量δ1和δ2来定量表达发生“至少”和“不超过”Nobs个地震事件的概率,计算公式为:
当δ1<αeff时,表明预测的地震数目过少; 当δ2<αeff时,表明预测的地震数目过多,其中αeff=0.5α。
ROC检验与R值评分有共同之处,在表现形式上给出不同危险概率阈值下各命中率与失败率的比值来描述预测的优劣程度(Holliday et al,2005)。变量a表示报准地震的格点个数,即预报有震的格点个数; 变量b表示误报地震的格点个数,即预报无震的格点个数; 变量c表示有地震无异常的格点数,即未报有震的格点个数; 变量d表示无地震无异常的格点数,即未报无震的格点数。则a+c表示总地震个数,b+d表示无地震的格点个数。定义报准率H=a/[KG0](a+c),虚报率F=b/[KG0](b+d)。定义预测ROC折线与随机预测直线所包络的面积Ef为有效预测系数,Ef值越大,表明ROC曲线越靠近图的左上部分,即在相同的报准率下付出的“虚报率”越低,预测效果越好,反之预测效果越差(图6)。
中国CSEP检验中心的建立有助于预测方法应用和评价的标准化。b值方法是一种研究较为深入的地震预测方法,能够实现震前数年、数月、数周、数天的预测,理论模型的认可度高,且对于检验中心平台的预测模块和检验模块的使用具有代表性。因此,我们以b值为例,介绍预测模块的标准计算流程。首先,选定b值预测模型,其次,按照输入参数界面配置计算参数,计算时段为2021年1月1日至12月31日,研究区域范围为(67°~136°E,15°~55°N),滑动步长为0.5°,计算空间窗为180 km×180 km; 震级下限为2.0。提取的b值预测区面积约占研究区域总面积的25%。
在b值计算结果的基础上,检验中心将自动匹配Molchan检验或R值检验模块(图7),根据设置的检验时段进行预测效能评价。2022年中国大陆共发生5级以上地震27次,其中20次发生在b值预测的危险区域内,命中率达到74%。对应的最佳预测结果的R值评分为0.49,结果优于α=1.0%的显著性。相关分析结果将自动推送并产出b值模型的预测效能评价报告。类似地,检验中心还能够产出未来数天至数年的b值预测和检验结果,并形成预测检验报告。
我国是世界上地震灾害最严重的国家之一。地震预报是实现防震减灾的重要途径,但我国地震预报的服务能力与日益增长的社会公共安全需求存在较大矛盾。CSEP检验中心代表了当前国际地震学界对地震预测预报研究现状的客观和全面认识下的新思路,可为地震学家对地震的物理机制、演化过程及规律提供新的认识。CSEP检验中心目前已在统计预测模型的构建和检验中心的建设等方面取得了阶段性的进展,标志着地震预测预报研究从追求“终极目标”转变为循序渐进的思路。
中国CSEP检验中心已经实现与该项目全球网络基础设施的对接,结合中国地震科学实验场项目的实施,可以带动和鼓励地震预测预报模型的自主研发,通过地震可预测性研究实践,提高地震工作者对地震可预测属性的科学认识。CSEP检验中心是开放性的,可以通过注册用户使用平台资源,中心对地震预测方法也持开放态度,任何方法都可以吸纳到平台进行预测效能检验和评价。CSEP检验中心的建设和研究计划的实施将成为中国地震预测预报理论研究的孵化器,并为推进地震预报研究与科技创新提供场所和科技支撑条件。
此外,CSEP检验中心的建立还有助于推进综合地震预报由定性向定量化的转变。中心在加强各种地震预测方法效能评价的基础上,逐步尝试发展地震综合概率预测模块,以效能评价为权重,通过贝叶斯公式整合得到各种方法的预测结果,量化确定地震危险区域,这项研究尚处于发展过程,还需要在检验中心补充更多预测模型,实现合理的综合概率输出。目前主要是采用将各种方法的预测结果(包括非本平台的地震预测方法产出结果)作为输入量进行计算和分析的方式,即模型的输入量还未实现完全的标准化,因此,分析结果不在这里进行展示。事实上,中国CSEP检验中心的建立,有助于推进我国的地震预报业务,结合检验中心对PI、LURR、地震调制比、b值等方法的检验结果,进一步加强对现有预测方法的评价,通过对比发现,中国大陆2022和2023年度危险区预测结果明显优于往年的平均预测水平。
中国CSEP检验中心软件系统虽然已经初步建立,但要真正实现推进地震预报工作的目的,还需要更多预测方法和检验方法的投入,以及大量的数据检验。
感谢为中国CSEP检验中心建设提供软件和数据支持的专家和单位。