基金项目:地震动力学国家重点实验室开放基金(LED2022B05).
第一作者简介:王锦红(1999-),硕士研究生在读,主要从事人工智能强余震预测研究.E-mail:17866618823@163.com.
通讯作者简介:蒋海昆(1964-),研究员,主要从事余震统计、余震机理及余震预测研究.E-mail:jianghaikun@seis.ac.cn.
(1.中国地震局地震预测研究所,北京 100036; 2.中国地震台网中心,北京 100045)
(1.Institute of Earthquake Forecasting,China Earthquake Administration,Beijing 100036,China)(2.China Earthquake Networks Center,Beijing 100045,China)
earthquake prediction; machine learning; feature extraction; model evaluation
DOI: 10.20015/j.cnki.ISSN1000-0666.2023.0022
地震预测是世界性的科学难题。在庆祝Science创刊125周年之际,该刊杂志社公布了125个最具挑战性的科学问题(Kennedy,Norman,2005),其中第55个问题明确提出:是否存在有助于预报地震的前兆?地震预测困难之处在于一方面涉及地震前兆的地球物理观测基本属于远离震源地方的地表观测,所观测到的物理量除包含可能的地震孕育信息外,更多的是与环境、路径、干扰等有关的信息; 另一方面是研究人员对地震孕震机理尚无清晰的认识,即地震预测的理论问题远未解决。因此,目前的地震预测基本停留在基于观测资料的现象类比和统计分析层面。
近几十年来,人工智能(Artificial Intelligence,简称AI)技术在计算机视觉和图像识别、时间序列分析和异常检测、生物医学等许多行业应用的成功经验表明,在理论问题尚未解决之前,AI技术对识别未知特性、发现系统隐含规律、解决实际问题等方面作用巨大,显著推动了相关行业的发展。AI是用于模拟和扩展人类智能的理论、方法和技术,开发相应应用系统的一门技术科学,而机器学习是AI的最重要组成部分,是一门研究如何实现AI的技术性学科,涉及统计理论、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等领域。即机器学习是从历史数据中学习特征和规律,然后将其应用到未知事物探索中的一门科学(中国电子技术标准化研究院,2018)。2006年“深度神经网络”概念被提出(Hinton,Salakhutdinov,2006),该方法具有能够在超大数据集中发现隐藏模式的性能,使其成为一种机器学习技术的新方法。
由于地震孕育的地球物理过程存在非线性和复杂性等问题,任何可记录的物理参数与未来地震的时间、震级或空间位置之间缺乏确定的数学或经验关系(Panakkat,Adeli,2007)。但随着AI技术的发展,基于已有地震观测数据的AI技术在地震预测领域得到越来越广泛的应用。学习大量观测数据可以发现其隐含的特征或规律,一方面有利于深化对地震机理的认识,更重要的是可以利用这些数据建立/训练模型,对未来数据进行拟合进而开展地震预测,这可以在机理和内在规律尚不清楚的情况下改善地震预测的准确性。
本文介绍了机器学习预测地震的一般流程,并从数据特征、模型算法和评价指标等方面,简要综述机器学习在地震预测领域的最新研究进展。
根据学习模式,机器学习主要分为有监督学习、无监督学习以及强化学习(图1)。有监督学习是指利用已标记的有限训练数据集,通过某种学习方法建立模型,实现对新输入数据的标记,要求训练样本的分类标签已知,分类标签精确度越高,样本越具有代表性,学习模型的准确度越高。最典型的监督学习算法包括回归(标签为连续变量)和分类(标签为分类变量)。无监督学习是利用无标记的有限数据描述隐藏在未标记数据
中的结构/规律,其典型算法包括降维、聚类等。强化学习是通过交互和反馈指导学习器进行决策,不同于以上两种学习方式,强化学习训练需要环境给予反馈,基于这种反馈不断强化学习器性能以完成特定的目的,其在机器人控制、自动驾驶、游戏等领域已有许多成功应用。
常见的机器学习算法还包括半监督学习、迁移学习等,其中半监督学习介于无监督学习和监督学习之间。经常遇到的实际情况是,部分数据有标签,部分数据无标签,无标签的数据数量远远大于有标签的数据。未标记的样本虽未直接包含标记信息,但若它们与完全标记的样本是从相同数据源独立分布采样得来,则它们所包含的关于数据分布的信息对建立学习模型将大有裨益,这也是半监督学习日益受到重视的重要原因。迁移学习是指当在某些领域无法取得足够多的数据进行模型训练时,利用另一领域数据获得的关系进行学习,可以把已训练好的模型参数迁移到新的模型上来指导新模型的训练,从而更有效地学习底层规则、减少数据量(中国电子技术标准化研究院,2018)。目前地震预测领域的机器学习基本上使用有监督学习类算法。
机器学习地震预测主要基于地震观测数据某些特征来进行,如地震活动性参数、地震前兆、地震波以及卫星监测数据等(Asencio-Cortés et al, 2016; Asim et al,2016; Niksarlioglu,Kulahci,2013; Wang et al,2022)。通过数据预处理,将其转换为适合分类或回归算法的形式,找到数据中隐藏的模式,以达到预测地震强度、发生时间和可能地点的目的。
目前的机器学习地震预测模型大多为降维预测,即大多只对未来地震的发震时间、地点和震级三要素进行单要素或其中两个要素进行预测。在实际应用中,还需对发震时间或震级进一步进行离散化或进行空间网格化,从而使预测过程简化为分类或回归问题。对于二元分类(如预测震级是否高于或低于阈值)或回归(如可能的震级估计),训练和预测的输出结果通常表达为概率形式。一般的机器学习地震预测模式和流程如图2所示,包括数据集建立、数据预处理、分类/回归模型构建、外推预测、结果或模型评估等5个环节。
在目前已开展的研究中,以地震目录为主的地震观测数据,由于其具有易获取、较好的完备性、无干扰、较长时期的数据积累等特性,成为机器学习地震预测最为常用的输入特征数据。通过简单的预处理可将地震目录转换成适合模型输入要求的形式,作为机器学习的输入来训练模型和开展预测,如直接将地震目录参数进行简单转换,将地震发生时间转换为序号(Zhang et al,2019)、将地震位置(经、纬度和深度)转换为预先划分好的网格(Wang et al,2017; Kail et al,2021)等。
Panakkat和Adeli(2007)基于地震统计参数及地震学中的基本统计特征,依据G-R关系和特征地震两个先验统计模型,将地震目录转换为8个地震活动性参数作为特征参数构建机器学习地震预测模型。8个预测特征参数中(表1中特征1~8),T为地震序列时间分布,Mmean为地震的平均活动强度,dE1/2为地震应变释放的快慢,η和ΔM为G-R关系b值及数据总体对G-R关系的偏离,μ和c为特征地震的平均复发周期及其离散程度,b值被用来描述研究区域的地震震级-频度特征与地震活动水平,是地震预测的一个常用指标参数。Reyes等(2013)基于ANN模型预测智利和伊比利亚半岛的地震,使用了7个特征参数(表1特征9~15),其中5个为等地震个数计算的G-R关系b值及等地震序号间隔的b值增量,目的是间接考察b值随时间的变化; 考虑最近的地震活动水平及预测区6级地震的背景危险性,将研究区近1周以来的最大地震震级及发生6级地震的背景概率也作为特征使用。Martínez-Álvarez等(2013)把上述所有特征合并用于机器学习建模。
之后,以这些指标为基础又演化出更多的特征参数,如Asencio-Cortés等(2016)考察了19个地震活动性相关参数在机器学习地震预测中的灵敏性,所使用的预测指标主要取自Panakkat和Adeli(2007)、Reyes等(2013)确定的地震参数,增加了不同震级间隔范围内地震计算所得的G-R关系a值、基于概率模型的复发时间Tr等参数及其组合(表1中特征16、17)。Asim等(2018a)利用机器学习对兴都库什、智利和南加州地区进行地震预测,把基于目录的预测指标全部汇集在一起,利用最小二乘和最大似然两种方法计算特征,将地震相关的特征参数扩充到60个,包括G-R关系系数、地震发生率、前震频次、地震应变释放等参数,基于最大相关和最小冗余(mRMR)准则来确定具体的入选特征。需要指出的是,有些特征的应用不但于预测效率提升无益,甚至可能会降低预测效果。因此,一些学者将特征选择技术应用于地震预测,发现G-R关系相关参数以及描述地震频次变化、发生时间、地震应变释放速率等参数,对机器学习地震预测具有较大的贡献度(Martínez-Álvarez et al,2013; Asim et al,2018a),地震率变化z、β(Asim et al,2016,2020,2018a,b),b值的标准偏差σb(Asim et al,2016,2018b,2020)等指标也被用于机器学习地震预测模型训练,具体见表1的特征18~20。
除基于地震目录构建的各类特征外,在地震预测中还用到一些其它类型的数据,如静态库仑应力变化(DeVries et al,2018)、地脉动(马士振等,2020)、氡浓度(Külahc et al,2009; Niksarlioglu,Kulahci,2013)、地电信号(Suratgar et al,2008; Moustra et al,2011)、强度函数(Nicolis et al,2021)、模型表面变形特征(Corbi et al,2019)等。除以上使用的地震特征外,还有研究通过深度学习方法从数据集中提取特征,再与传统地震特征相融合来开展地震预测(Li et al,2020)。
AI领域存在较多的外推预测算法,与之对应的评价机制对于模型的训练和优化显得尤为重要。地震预测模型评估指标中,最简单的方法是通过混淆矩阵来进行评测,这也是机器学习中最常见的模型评估方法,主要用于地震预测中诸如地震事件是否发生的二分类问题,其中混淆矩阵的4个指标(表2)描述了所有可能预测的结果。True Positive(简称TP):预测有震且实际有震的数量,即有震报准的数量。False Positive(简称FP):预测有震但实际无震的数量,即虚报的数量。True Negative(简称TN):预测无震且实际无震的数量,即无震报准的数量。False Negative(简称FN):预测无震但实际有震的数量,即漏报的数量。
混淆矩阵在机器学习地震预测评价领域得到较多的应用,如Gulia和Wiemer(2019)用混淆矩阵评估了“红绿灯”形式的分类器在地震发生过程中对地震序列属于前震还是余震进行实时识别的能力; Mignan和 Broccardo(2020)利用混淆矩阵分析了ANN模型与其它机器学习简易模型在预测增益上的不同。但总的来看,由于混淆矩阵统计的只是地震的次数,单一的统计值很难全面衡量模型的优劣,因此在混淆矩阵的基本统计结果上又延伸出许多检验指标,见表3。与混沌矩阵有关的模型评估曲线可以更直观地显示预测效能评价结果,例如Precision-Recall(简称P-R)曲线(Kail et al,2021)、Receiver Operating Characteristic(简称ROC)曲线(Kanarachos et al,2017)、Area Under Curve(简称AUC)曲线(DeVries et al,2018; Aslam et al,2021)等,这些曲线可直接用于二分类问题,但无法直接应用于多分类问题。在一些地震预测回归算法中,还使用了平均绝对误差Mean Absolute Error(简称MAE)(Alarifi et al,2012; Nicolis et al,2021)、均方误差Mean Squared Error(简称MSE)(Alarifi et al,2012; Nicolis et al,2021)、均方根误差Root Mean Squared Error(简称RMSE)(Hu et al,2012)、相对误差Relative Error(简称RE)(Asencio-Cortés et al,2018)等指标来表征预测值和观测值之间的差异。由于不同地震预测模型的要求不同,需根据具体的预测模型选择合适的评价指标,才能得到有效的评估结果,进而对模型进行反馈和优化。
机器学习思想在地震预测中的应用最早起源于我国20世纪80年代,如石绍先和范杨(1990),石绍先和沈斌(1986)研究了多级判别、聚类分析等在地震预测中的应用,后续这种思想延伸到了神经网络中。由于神经网络在处理复杂的非线性问题时具有明显的优点,不需要对象有精确的数学模型,可通过神经网络结构的可变性,逐步适应外部环境的各种因素作用(王炜等,2000a),许多学者将其应用于地震综合预测(蔡煜东等,1993; 李荣峰,2000; 王炜等,2000; 王炜,吴耿峰,2000,2006a,b; 陈一超等,2008; 韩晓飞等,2012)。蔡煜东等(1993)运用神经网络对我国西南地区17个震例进行分析,建立了地震综合预报专家系统,对确定地区、确定时间范围内的地震强度进行预测; 李荣峰(2000)建立人工神经网络模型预测福建及其周边地区的年度最大地震震级,该模型的输入值为4个地震参数(b值、ML≥2.5地震的频次、每年地震释放总能量∑E和空间集中度C值),兼顾地震三要素,预测准确率可达90%; 王炜等(2000b)进一步探索Back Propagation(简称BP)神经网络在地震中期预报中的应用,结果表明中强地震前1~3 a,未来震中周围一般都开始出现明显的异常区,BP神经网络显示出一定的中期预报效果。但由于BP神经网络存在收敛速度慢、易陷入局部最小点等不足,陈一超等(2008)提出利用具有全局搜索能力的遗传算法,建立遗传算法和神经网络相结合的震级预测模型,震级预测误差小于传统BP神经网络; 韩晓飞等(2012)提出基于遗传算法结合广义回归神经网络的地震预测算法,震级预测误差也小于传统的BP神经网络算法。
尽管国内开展了许多探索性研究,但总的来看国外在人工智能地震技术研究方面远远走在前列。地震预测的重点是震级、时间、地点三要素,但目前大多数研究主要关注震级预测问题,即在固定区域、固定时间窗前提下,评估某级以上地震的发震可能性,即大多数研究实际上是将地震预测问题进行降维处理,转化为在固定区域、固定时间段内“有”或“无”某级以上地震发生的分类问题。
人工神经网络(Artificial Neural Network,简称ANN)较早被应用于地震预测研究。Alves(2006)针对地震时间序列的混沌特性,借鉴“金融振荡器(financialoscillators)”工具构建地震相关数据集,利用ANN对1998年7月和2004年1月2次5级以上地震进行预测,虽然预测时空、窗口较大,但也在一定程度上证明了ANN模型的地震预测潜力。为进一步探索ANN的地震预测效能,Reyes等(2013)采用ANN模型对指定区域未来5天内地震趋势进行预测,得到ANN预测效能受区域差异影响较大。而对于相同区域的预测,许多研究显示ANN似乎优于决策树、支持向量机、朴素贝叶斯、K-最近邻、ANFIS等分类器(Reyes et al,2013; Morales-Esteban et al,2013; Pandit,Pandal,2021)。也有研究指出,由于地震目录的结构化和表格化性质及有限的特征数量,比ANN更简单、更透明的机器学习模型似乎更为可取(Mignan,Broccardo,2019)。
Panakkat和 Adeli(2007)采用前馈反向传播神经网络Levenberg-Marquardt(简称LMBP)、递归神经网络Recurrent Neural Network(简称RNN)和径向基函数神经网络Radial Basis Function(简称RBF)3种模型预测南加州和旧金山地区1991年1月至2005年9月后续单位时间(月)的地震强度,模型输入即表1中8个地震相关特征参数,并使用4种不同的统计指标(检测概率POD、虚警率FAR、频率偏差FB和R分数)评估模型的预测精度,结果表明与LMBP和RBF网络相比,RNN具有更高的预测精度,尤其在中强度地震(5.5≤M<6.5)预测时,不同模型之间的差距最明显; Adeli和Panakkat(2009)使用特征作为概率神经网络(Probabilistic Neural Network,简称PNN)的输入来预测相同地区的地震,结果显示PNN对M≤6.0地震的预测结果比RNN更好。上述8个地震参数还被用于预测兴都库什和巴基斯坦北部的地震,在兴都库什地区,线性规划增强集成分类器(Linear Programming Boosting,简称LPBoost)在预测灵敏度方面有比较好的结果,而神经网络则倾向于产生更低的误报率(Asim et al,2016); 在巴基斯坦北部地区,前馈神经网络则表现更好,其准确率可达75%(Asim et al,2017b)。从上述研究可见,即使用相同的地震活动性特征和相同的机器学习算法,在不同地区也会产生不同的预测效果,可能是由每个区域构造及地震活动特点存在差异所致。尽管机器学习提供了特征或模型选取算法,但主要为针对特定数据的模型与数据之间吻合程度的一系列统计学指标,不同特点的地震活动区域适用哪些特征和算法并没有明确的认识,还是只能使用不停的尝试、检验、调参等方法来进行选择和优化。
随观测数据的急剧增加,ANN模型不断复杂化,深度神经网络Deep Neural Networks(简称DNN)、RNN等学习模型也不断推出。Li等(2020)提出一种可以有效融合显性和隐性特征的深度学习模型A Deep Learning Model for Earthquake Prediction(简称DLEP),在8个具有不同特征的典型地震带上进行测试,认为DLEP在地震震级预测方面具有更好的泛化能力和更高的准确性。RNN的优势在于对序列数据具有记忆,能够更好地反映地震活动的时间依赖特性,因而也被应用于地震预测研究。长短期记忆网络Long Short Term Memory(简称LSTM)作为一种特殊的RNN能够更好地解决长序列训练过程中的梯度消失和梯度爆炸问题,因而被广泛应用,如Wang等(2017)从地震活动空间相关的角度出发,利用LSTM学习不同位置地震之间的时空关系,即使在地震监测能力低的地区,仍然能够使用该方法判断是否有地震发生; Kail等(2021)同样基于LSTM,研究预测震级高于给定阈值的地震是否会从选定时刻开始的10~50天在给定区域发生,并进而解释日本地区历史地震之间的时间依赖特性。由于卷积神经网络(Convolutional Neural Network,简称CNN)和RNN等震相自动识别技术的出现,基于深度学习的地震监测技术快速发展(Perol et al,2018; Mousavi,Beroza,2020),使得地震监测台网可检测出更多的地震事件,其空间分辨率和震级完备性也显著提高,这不但可以改进传统的统计和基于物理的地震预测方法,对基于AI的预测方法、特征构建以及模型训练也大有裨益(Mousavi,Gregory,2022)。
同一种数据、多种机器学习模型的联合使用和相互印证可能是当前可以考虑的一种途径,如Asim等(2018b)将地震特征与基于遗传规划Genetic Programming(简称GP)和自适应增强Adaptive Boosting(简称AdaBoost)集成分类方法相结合,定义了一个地震预测系统(Enhanced Particle Swarm Optimization,简称EPSO),用于预测未来15天M≥5.0地震发生的可能性,对兴都库什、智利和南加州地区进行的地震预测,预测精度P1分别为74%、80%和84%,与Asim等(2017b)预测结果相比,提高了约15%; 在巴基斯坦北部也印证了EPSO系统的低误报率(Aslam et al,2021)。Asim等(2018a)利用基于支持向量回归器(Support Vactor Reression,简称SVR)和混合神经网络(Hybrid neural network,简称HNN)的混合系统再次对以上3个地区进行地震预测检验,与灵敏度高达90%但精度P1较小的SVM-HNN预测模型相比较,该分类预测模型灵敏度相对低但精度P1较高,从实际应用的角度更为可取(Asim et al,2018b)。Asencio-Cortés等(2018)利用1970—2017年南加州地区约140万多条地震目录数据,采用16种地震特征参数,探索了4种回归算法(广义线性模型、梯度推进机、深度学习和随机森林)与集成学习相结合用于时间窗为7天的中强地震震级预测尝试,不同算法预测震级与实际震级的对比结果显示非常离散。史翔宇(2021)采用相同的16个地震活动性特征参数,对上述4种模型对预测结果的单独贡献进行分析,发现G-R类特征参数贡献度较大,地震能量类特征参数次之,不同模型和特征参数在不同地震区(带)的地震预测贡献度有较大的差异。
纯粹的分类/聚类算法也被用于地震预测研究,如Florido等(2015)将原始数据转换成包含地震活动性参数b值的数据集,应用聚类算法对转换后的数据集进行离散化,构建地震活动的参数“序列”,将指定区域M≥4.4地震作为标签,对M≥4.4地震前的所有“序列”进行搜索,找出可能的地震前兆“序列”用于地震预测,在指定的评价语境下,其结果的准确率接近70%,肯定了所提出方法的有效性; Shodiq等(2015)提出一种空间分析和自动聚类技术来判断后续是否有大地震发生,使用山谷追踪技术确定最佳分类数为6类,在质心K均值优于其它K均值的情况下进行分层聚类,其结果显示对印尼地区未来1~6年的地震预测具有较高的准确性; Shodiq等(2017)进一步将自动聚类和人工神经网络相结合,预测印尼地区发生5.1级地震后5天内发生5.5级或6级以上地震的可能性,结果表明该模型能较好地预测6级以上地震,P0、P1、SN、Sp四项指标平均值达到75%,其中P0高达97%; Shodiq等(2018)使用同样的方法对该区域的余震进行预测,发现对M≥6地震的余震具有较好的预测效果,特异度Sp为99.16%。
与计算机视觉类似的地震活动图像识别也被用于地震预测,如Huang等(2018)提出一种基于图深度学习的机器学习地震预测方法,将中国台湾地震活动图转换为图像,共产生65 536个特征(对应256×256像素图像),利用CNN从标有地震信息的地理图像中提取隐含特征,用过去120天的地震事件预测未来30天的地震。如果未来30天的最大地震震级大于等于6级,则将该图像标记为1,否则标记为0。该CNN模型的R值评分约等于0.303,在不需要人工设计特征的情况下,该方法已展现出良好的应用前景。
目前大多数机器学习地震预测研究均针对指定时空域的未来地震活动水平估计,对地点及时间预测的研究并不多,如Madahizadeh和Allame-
hzadeh(2009)基于人工神经网络对余震空间分布模式进行了研究,但研究对象仅为一个地震序列。DeVries等(2018)基于DNN对余震空间分布区域进行预测研究,共使用了一个包含30 000多个主震-余震对的独立测试数据集对余震进行二元分类(余震存在或不存在),其模型特征主要基于主震破裂模型计算的应力变化张量而设计,并非常用的地震活动性特征; DNN模型包含6个隐藏层,每个隐藏层由50个节点组成,总共产生13 451个自由参数,DNN在测试数据集上遍历所有的破裂滑移分布和网格单元得到的累积AUC值为0.849,大于经典库仑破裂应力准则AUC值(0.583),与ROC评价结果对比来看也是如此(图3)。结果表明DNN在余震地点预测方面比传统库仑破裂应力变化有更好的优势,能够更好地解释余震的空间分布。他们进一步分析认为,对余震地点预测起主要作用的是偏应力张量第二不变量,因而认为DNN给出的预测结果在物理上可解释。该项工作受到广泛关注的同时也引起极大的争议,如Mignan和Broccardo(2019)认为,余震预测属于一种降维预测,本身就应该比主震预测容易,仅用较简单的ANN就完全可以达到很好的效果,且无需应力相关参数的计算,简化了余震预测过程, 限制了模型偏差,深化了对余震机理的认识和对预测模型的改善。
图3 传统库仑破裂应力变化(a~c)和神经网络(e~g)预测余震位置的方法,及其对应的ROC曲线(d、h)(据DeVries et al,2018)
Fig.3 Traditional methods for predicting aftershock location by coulombic stress change(a-c)and neural network(e-g),and their corresponding ROC curves(d,h)(according to DeVries et al,2018)
机器学习对地震发生时间的预测,目前仍停留在环境条件单一的实验室观测数据处理,而Rouet-Leduc等(2017,2018)基于剪切摩擦实验AE连续波形记录和同时期的剪应力记录,训练随机森林模型,训练样本约占记录数据的60%,预测并重现了另外约40%时间段的剪应力变化(图4)。这意味着可以通过连续波形记录,预测断层失稳(比拟于大地震)的时间。
图4 利用随机森林从断层摩擦实验声发射记录重构外加载荷应力变化曲线(据Rouet-Leduc et al,2018)
Fig.4 Reconstructing the applied load stress change curve from the acoustic emission recording of a fault friction experiment using a random forest(according to Rouet-Leduc et al,2018)
Hulbert等(2019)基于实验室观测数据开展了类似的重构应力变化过程的研究,并进一步将机器学习用于常规地震与慢地震(包括震颤和瞬时加速和自驱动传播等其他慢滑模式)的识别,其研究肯定了预测各种粘滑和蠕变-滑动失稳模式的可行性,认为灾难性地震失稳前可能会有一组有组织的、潜在的可预测过程。但总的来看,迄今为止尚未见到类似方法在实际地震记录中的应用,其难点可能在于与实验室环境条件相比较,实际环境过于复杂。Wang 等(2021)利用迁移学习算法处理实验室剪切实验数据,实验数据来自一个双轴剪切装置,该装置可记录声发射数据以及计算摩擦系数所需的法向应力和剪切应力。首先通过数值方法模拟实验室观测数值,利用模拟的实验室数据训练机器学习模型,然后将其应用到实验室实际观测数据中预测地震(断层滑移),实现了从数值模拟到实验室剪切实验的迁移学习,同时引入交叉训练的方法来模拟实际地震观测数据不足的情况。结果表明实验中的失稳时间预测要比强度预测更加准确。通过迁移学习,研究人员可以从一个模型推广到另一个模型,从而克服数据的稀疏特性,但其所采用的数据驱动的方法仅对慢滑事件有效,而对于大规模粘滑断层却作用有限。
近期有学者对机器学习在地震预测研究中的概况也进行了总结(Mignan,Broccardo,2020),如Al Banna等(2020)利用“Earthquake”“Prediction”“Neural Network”“Machine Learning”等关键词搜寻了292篇相关论文,经过筛选最终选择84篇进行进一步分析,结果显示利用AI进行地震预测的文章数量近些年呈逐渐上升的趋势且涵盖了几乎所有的AI方法,其中ANN应用最多(约占33%)。按不同作者各自的评价规则及数据,23种AI算法的预测成功率均达到60%,其中神经动态分类-优化模型、反向传播自适应模型和改进的人工蜂群-多层感知系统以及随机森林等的预测准确率相对更高。DNN对复杂问题表现出更优的解决问题能力,在地震预测研究中应用也较为广泛。
地震预测是地震危险性评估、震灾预防和建筑结构安全设计的关键。随着观测站网密度增加,地震和地震物理观测技术的进步,地震观测数据急剧增加,使AI技术可以更好地发挥其在大数据处理、隐式特征提取等方面的优势,以此识别各类地震观测数据中的未知特征或规律,对地震的发生时间、可能震级等进行预测。本文对国内外机器学习在地震预测领域中的应用进行总结发现,数据的稀缺性、数据收集的质量以及同一模型在不同位置的性能可变性等问题都会显著影响模型的性能。在这里,我们将讨论地震预测研究中面临的困难,并提出克服这些困难的一些方法。
(1)机器学习能够发挥计算机处理大数据的优势,可发现人工难以直观观察到的某些震前特征。机器学习技术的应用,开拓了针对非线性复杂系统的地震孕育发生过程的新的研究途径,对提升地震预测能力起到重要的促进作用,其中以ANN为基础发展起来的神经网络是最常见的地震预测模型。
(2)目前已有的研究大多采用基于区域地震活动特征的特征提取方法,由于每个地震带都有其独特的地震活动特点,建立精确的区域地震预测模型时,需要考虑特征参数的区域性差异。这种“个性化”的方法在不同区域的实际应用中其结果差异尤其明显,在一个区域表现得较好,可能在另一个区域则表现不佳。由于机器学习地震预测模型主要基于数据驱动,而地震发生又是小概率事件。对于一个特定的区域,其模型训练和检验样本数据一般都匮乏,这不仅需要未来在更多地区、更长时段、对更多震例的积累和研究,还应创建基准地震数据集,对地震模型进行测试,以简化不同模型的比较过程(Al Banna et al,2020)。
(3)地震预测包括时间、地点及震级3个维度。由于地震孕育过程的极端复杂性及三要素预测的极端困难,目前大多数机器学习地震预测研究主要集中于指定时空域内地震活动的震级预测。随计算机处理速度的提升、AI技术的发展和可用资料的进一步积累,未来应思考如何能够同时提升地震时、空、强三要素的预测能力。
(4)地震与区域构造环境、地震之间具有非常复杂的非线性相互作用。当前的机器学习并不能清晰地解释这种高度的非线性关系,因此仍需要进一步研究各个地震参数的相互关系,找出它们的影响因素和物理成因,并结合现有对地震及地震前兆成因、特点、震例的认识,考虑物理约束的半监督学习算法,采用物理模型约束下的数据驱动方式,可能是机器学习等AI技术在地震预测领域能够更好地发挥作用的重要途径之一。当前,基于机器学习对输入特征重要性的进一步认识,也可说明某些强相关特征与未来强震活动之间可能存在物理关联,这也为深化地震前兆物理机理的认识提供了一条可能的途径。
(5)相对于真正的大数据,用于地震预测的数据和学习样本仍十分匮乏,加之同一模型、相同特征在不同区域的预测效能差异极大,因而机器学习地震预测研究仍有许多问题亟待解决,这些问题显著影响着机器学习地震预测模型的预测效能。尽管基于神经网络的预测方法更直接地结合了结构化地震目录完整的时空结构,还利用了诸如DNN等算法的自动特征提取能力,但这些研究大多仍处于实验阶段,侧重于比较不同深度学习或经典机器学习预测因子的相对性能。深度学习地震预测模型是否为能够为地震可预测性提供新的见解,以及它们是否比传统的“统计+经验”的方法表现更好,仍有待进一步的研究和对比(Mousavi,Gregory,2022)。
当前机器学习地震预测算法主要基于地震目录等地震观测资料,基于形变、电磁、流体等地球物理观测资料的机器学习地震预测算法或模型尚不多见。我国长期的地震预测实践表明,形变、电磁、流体等地球物理观测资料对地震短期预测可能具有不可替代的作用。地球物理观测资料是以秒或分钟为单位的等间隔采样数据,因而时间连续,大量成熟的机器学习时间序列预测算法可尝试应用于基于地球物理观测资料的地震异常识别和地震预测; 地球物理观测资料易受环境和人为因素影响,机器学习异常检测类算法可用于地球物理观测资料的异常识别以及异常机理或影响因素分析,这方面的探索近期已有成果。因而,基于地球物理观测资料的机器学习地震预测研究是一个值得探索的领域。