Reconstruction method for diurnal variations ofthe geomagnetic field by XGBoost machine learning
-
摘要: 为了重构或恢复存在严重干扰或数据缺失的台站观测数据,本文基于周边已有台站的高质量观测数据采用XGBoost机器学习方法重构地磁日变数据。仿真试验结果显示,无论是磁静日还是磁扰日,地磁场分量的绝对残差均值均低于0.1 nT。试验统计数据及重构结果残差曲线的对比分析表明,地磁日变重构精度与地磁活动性和待重构信号的时变剧烈程度有关;相较于反向传播神经网络,XGBoost方法对地磁场日变数据的重构精度更高。本文研究表明,基于XGBoost机器学习的重构方法在处理非线性复杂问题方面具有优势,能够用于高精度重构存在严重干扰或数据缺失的地磁台站观测数据的重构。Abstract: The long-term observation data of the geomagnetic field based on the geomagnetic stations (networks) are of great value for studying the spatio-temporal variation rules, characteristics, also and the field source information of the geomagnetic field. However, due to infrastructure and human activities (such as high-speed rail, highways, power grids, etc) as well as sudden instrument failures, there are interferences and missing observation data in some time periods for some observation stations. Therefore, this paper utilizes the XGBoost machine learning method to reconstruct the observation data of some stations with severe interference and missing data based on the high-quality observation data of existing stations in their surrounding areas. The results of simulation experiments show that the reconstruction residuals of geomagnetic field components are lower than 0.1 nT whether in magnetically quiet days or in disturbed days. Further comparative analysis of the experimental statistics and residual curve illustrates that the reconstruction accuracy mainly depends on the geomagnetic activity and the time-variable complexity of the signals to be reconstructed, and in addition the reconstruction accuracy by XGBoost method is higher than that by the BP neural network. This research suggests that, the reconstruction method by XGBoost machine learning has an advantage in dealing with nonlinear complex signals, and thus can be effectively applied to reconstruct the observation data of some stations with severe interference and missing data.
-
Keywords:
- data reconstruction /
- geomagnetic field /
- diurnal variations /
- XGBoost /
- machine learning
-
引言
地磁场是地球最基本的天然物理场之一,具有时空多尺度变化特征,包含着从地心至行星际空间范围之内大量的物性结构和动力学信息,对于理解整个地球系统的起源与演化具有重要意义,因此在资源勘探、地质调查、地球内部结构与动力学、军事与国防、自然灾害等诸多领域发挥着重要作用(徐文耀,2003;管志宁,2005)。
在众多地磁场观测平台中,地磁台站(网)可以对地磁场进行长期连续的观测,其数据对于研究地磁场的时空变化规律、特征及其场源信息等具有重要价值(安振昌,1999;安振昌等,2014)。随着国民经济建设、国家军事与国防等的快速发展,我国地磁台网的建设与运行日趋完善,但是在大部分地区依然存在地磁台站的空白区。此外,基础设施(如高铁、公路、电网等)、人类活动以及仪器突发故障等均会导致部分台站在某些时段的观测数据存在严重干扰和缺失。因此,基于周边已有台站的高质量观测数据,重构或恢复存在严重干扰和数据缺失的台站观测数据或构建未有台站地区的地磁场时变数据,对于地磁台网观测数据的进一步研究与生产应用(例如磁法勘探的日变校正等)具有重要意义。
在地磁场时变观测数据重构方面,国内外已有很多研究成果。姚法章(1988)采用订正法校正了地磁场观测数据中的畸异值并填补了缺失时段的数据,提高了月均值的观测精度;朱兆才(1989)基于时变地磁场在一定空间范围内具有的相关性,对缺测前、后一定时段内的观测数据与周边台站在相同时段的观测数据进行回归分析,得到回归方程,之后利用周边台站的观测数据填补目标台站缺失时段的观测数据,其重构结果稳定且精度较高;单汝俭等(1990)提出了二维多项式最小二乘拟合法、时空拟合法和线性内插法等三种局部地区地磁日变拟合方法;郭建华和薛典军(1999)采用函数拟合法和加权平均法,基于多台站的地磁场日变观测数据比较可靠地解决了大范围(跨度在10 km左右)航磁测量中的地磁场日变校正问题,徐行等(2007)也将加权平均法用于远海磁测的日变改正问题,边刚等(2009)采用多站同步实例分析了加权平均法和函数拟合法在海洋磁测地磁日变改正中的应用效果;卞光浪等(2010)基于地磁场日变主要取决于纬度效应的特征,提出纬差加权法并将其用于海洋磁测的日变改正;张向宇等(2016)则采用多个台站的实测数据对比分析了纬差加权法与回归分析法的效果,认为前者在推算位置纬差超过3°时外推数据误差较大,而后者可以突破3°的限制;潘星辰等(2020)以经度链为基准站,利用基站数据得到日变值与磁纬度的拟合函数进行纬度改正,再调整时差进行经度改正,最终得到计算站的日变值,其结果表明相较于加权平均法,该方法在远距离(经度差达40°)仍能保持较高的校正精度(<4 nT);姚休义(2015)和姚休义等(2016)运用空间加权法对缺失数据进行了重构研究,但是在强磁扰时段或高频信号的情况下该方法的重构精度较差,之后,姚休义等(2018)在距离数据缺失台站一定范围之内选取参考台作为输入,通过构建非线性反向传播(back propagation,缩写为BP)神经网络进行地磁观测数据的重构,其仿真测试结果显示,磁静日重构平均残差仅为0.11 nT,磁扰日平均重构残差为0.23 nT,取得了较好的效果。
综上,前人研究表明,尽管地磁场的日变化会受到局部地下电性结构差异及震磁效应等的影响,但主要取决于电离层与磁层的电流体系。由于电离层和磁层的电流体系距离地表较高,地磁日变在地表一定空间范围之内具有相关性,因而利用周边台站高质量的观测数据重构目标台站的缺失或干扰数据具有理论依据和可行性。但机器学习对地磁场日变数据的重构研究仅局限于BP神经网络,所以提出新的机器学习方法用于试验对比地磁场日变数据的重构研究具有重要意义。随着地球探测数据的大量积累、计算机模拟技术的长足发展,地球本身的复杂性以及地球内部的间接性探测特征研究的进一步深入,机器学习的各种方法正被加速应用于地球物理学研究中(Hajian,Styles,2018;Bergen et al,2019)。考虑到地磁场的日变化存在复杂的非线性时空差异特征,因此本文拟采用梯度提升决策树(gradient boosting decision tree,缩写为GBDT)的最新算法XGBoost (eXtreme Gradient Boosting)对地磁日变数据进行重构研究,并且与基于BP神经网络的重构结果进行对比分析,以期提高存在严重干扰或缺失数据的地磁台站地磁日变数据的重构精度。
1. XGBoost重构方法
在随机森林和集成学习(random forests and ensemble learning)这类机器学习方法中,梯度提升决策树作为一种迭代的决策树算法,具有较强的泛化能力,主要用于回归分析和分类(Friedman,2001)。Chen和Guestrin (2016)提出一种新型提升决策树算法即XGBoost,相较于传统的机器学习算法,该算法的改进主要表现在:引入正则项,防止过拟合;不仅使用一阶导数,还使用二阶导数,使“损失”更精确;支持并行优化,并且在“特征粒度”层面上进行,大大提高了运算效率;支持列抽样,不仅能防止过拟合,还能减少计算量。XGBoost在多特征、少样本数据处理中具有较好的灵活性和准确性(吴双,石宇强,2019),并且在表格数据中具有较好的表现。
1.1 XGBoost的拓扑结构
集成学习方法是指由多个学习模型组合以获得更好的学习效果,这样组合后的模型具有更强的泛化能力,其中的各学习模型并非相互独立,其结果由多个模型进行联合决策。XGBoost采用了集成学习思想,其模型组合的单位是分类回归树,XGBoost的拓扑结构如图1所示,该算法通过使每一轮迭代得到的损失函数沿着梯度下降方向来构造一个弱分类器函数,然后把多个弱分类器的结果以一定权重组合的方式形成强分类器,从而进行最终的预测输出(李超等,2019)。
1.2 XGBoost的算法流程
XGBoost主要具有两大关键点,第一是前向分布算法,第二是加法模型。由这两个关键点可知,往模型中加入第t棵树时,有
$ {\hat{y}}_{i}^{t}{\text{=}}{\hat{y}}_{i}^{t{\text{-}}1 }{\text{+}}{f}_{t}\!\!\!\!{\text{(}}\!{x}_{i}\!{\text{)}}\!\!\!\!{\text{=}}\sum\limits _{k{\text{=}}1}^{t}{f}_{k}\!\!\!\!{\text{(}}\!{x}_{i}\!{\text{)}}\!\!\!\!{\text{,}} $
(1) This page contains the following errors:
error on line 1 at column 1: Start tag expected, '<' not foundBelow is a rendering of the page up to the first error.
$\varOmega \left({{f_k}} \right) {\text{=}} \gamma T {\text{+}} \frac{1}{2}\lambda \sum\limits_{j {\text{=}} 1}^T {w_j^2} {\text{,}}$
(2) 式中,T和w分别表示树fk中的叶子节点数量和叶子权重,γ与λ为正则化参数。
预测模型的损失函数Obj (其中误差函数选用均方误差函数)表示为
$ Ob\!j {\text{=}} \sum\limits_{i {\text{=}} 1}^n {l\left[ {{y_i}{\text{,}}{{\hat y}_i}^{ {t - 1} } {\text{+}} {f_t}\left( {{x_i}} \right)} \right]} {\text{+}} \gamma T {\text{+}} \frac{1}{2}\lambda \sum\limits_{j {\text{=}} 1}^T {w_j^2} {\text{+}} C{\text{,}} $
(3) This page contains the following errors:
error on line 1 at column 1: Start tag expected, '<' not foundBelow is a rendering of the page up to the first error.
$ Obj {\text{≈}} \sum\limits_{i {\text{=}} 1}^n {\left[ {{g_i}{f_t}\left( {{x_i}} \right) {\text{+}} \frac{1}{2}{h_i}f_t^2\left( {{x_i}} \right)} \right] {\text{+}} \gamma T {\text{+}} \frac{1}{2}\lambda \sum\limits_{j {\text{=}} 1}^T {w_j^2} } {\text{,}} $
(4) 其中
$ {g_i}{\text{=}}{\partial _{{{\hat y}^{{\;t {\text{-}} 1} }}}}l\left({{y_i}{\text{,}}{{\hat y}_i}^{{\;t {\text{-}} 1} }} \right) {\text{,}} {h_i}{\text{=}}\partial _{{{\hat y}^{{\;t {\text{-}} 1} }}}^2l\left({{y_i}{\text{,}}{{\hat y}_i}^{{\;t {\text{-}} 1} }} \right){\text{.}}$
(5) 对样本中xi的遍历即为对所有树的叶节点遍历,将式(4)中对xi的遍历转换成对叶节点的遍历,则有
$ Obj {\text{≈}} \sum\limits_{j {\text{=}} 1}^T {\left[ {\left({\sum\limits_{i \in {I_j}} {{g_i}} } \right){w_j} {\text{+}} \frac{1}{2}\left({\sum\limits_{i \in {I_j}} {{h_i} {\text{+}} \lambda } } \right){w^2_j}} \right] {\text{+}} \gamma T}{\text{,}} $
(6) This page contains the following errors:
error on line 1 at column 1: Start tag expected, '<' not foundBelow is a rendering of the page up to the first error.
$ Obj{\text{=}}\sum\limits_{j {\text{=}} 1}^T {\left[ {{G_j}{w_j} {\text{+}} \frac{1}{2}\left( {{H_j} {\text{+}} \lambda } \right){w^2_j}} \right] {\text{+}} \gamma T} {\text{.}} $
(7) 对式(7)中wj求偏导并使其等于零求得wj,再将wj代入式(7)则有
$ Obj{\text{=}} {\text{-}} \frac{1}{2}\sum\limits_{j {\text{=}} 1}^T {\frac{{{G_j}^2}}{{{H_j} {\text{+}} \lambda }} {\text{+}} \gamma T} {\text{.}} $
(8) 上式所得Obj可作为衡量树结构质量的得分函数,其分值越低,表示树结构越好。确定最佳树结构是XGBoost的核心问题。然而,枚举所有可能的树结构以寻求最优Obj分值由于需要消耗较大的计算量而难以实现。针对这个问题,XGBoost采用贪心算法搜寻最优的树结构,每次选取增益最大的分割点进行分裂,其增益表达式为
$Gain {\text{=}} \frac{1}{2}\left[ {\frac{{G_L^2}}{{{H_L} {\text{+}} \lambda }} {\text{+}} \frac{{G_R^2}}{{{H_R} {\text{+}} \lambda }} {\text{-}} \frac{{{{\left({G_L^2 {\text{+}} G_R^2} \right)}^2}}}{{{H_L} {\text{+}} {H_R} {\text{+}} \lambda }}} \right] {\text{-}} \gamma {\text{,}}$
(9) 式中,Gain为信息增益,等式右侧四项依次表示分割方案的左子树分值、右子树分值、不分裂分值和加入新叶子节点引入的复杂度代价。当树达到深度限值或所有节点分裂方案满足 Gain<0时,即停止分裂(吴琼等,2020)。
1.3 XGBoost的训练过程与参数设置
本文采用K折交叉验证方法(Kohavi,1995)辅助训练模型,其原理是每次将训练样本划分为K个子集,选K-1个子集作为训练集,剩余的一个子集作为验证集,以此进行K折交叉验证试验,分别取每次的均方误差,将其用于评价预测结果的准确性,在XGBoost中可以调用xgb.cv函数实现。本文中参数优化采用贝叶斯优化算法(Xia et al,2017;Pelikan et al,2002),基础学习类型采用gbtree,树的最大深度为3,收缩步长即学习速率取0.05,子模型个数为300,并行线程个数为5,每棵树的随机采样比例为0.8,子样本比例为0.2。
2. 方法测试与比较分析
2.1 测试数据
为了测试XGboost方法的重构精度,本文对其进行了仿真试验。鉴于观测数据的质量会对重构的精度产生较大影响,仿真试验选取的台站需要保证数据质量,因此一般选取受干扰较小的台站。冯志生等(2005)的研究表明,当两个台站之间的距离不大于1000 km时,地磁时变记录具有较高的相关性,相关系数均大于0.9,随着台站间距的增大,相关性降低。此外,为了对比分析BP神经网络与XGBoost方法重构效果之间的差异,本文选取与姚休义等(2018)一文相同的时期、输入台站和输出台站,即选取红山台作为输出台站,在以红山台为中心的750 km范围之内选取输入台站,考虑到数据质量,选取泰安台(距离红山台253.1 km)、榆林台(距离红山台454.4 km)、蒙城台(距离红山台478.5 km)、乾陵台(距离红山台662.7 km)作为输入台站,数据选取的是各台站磁通门磁力仪的D,H和Z分量的秒采样数据,分辨率为0.1 nT。为了分析地磁活动性对重构精度的影响,选取2013年1月22日和6月2日作为红山台待重构的时段。从Kp指数上来看,1月22日地磁活动性较低,而6月2日地磁活动性较强,可以分别将其作为磁静日和磁扰日的代表日期(姚休义等,2018)。
2.2 精度评估方法
假设某一天红山台全天数据缺失,需要重构出当天的数据,本文选取缺失日期前一天的数据作为训练集,利用BP神经网络和XGBoost两种方法,分别对模型进行训练,进而利用缺失当天的输入台站数据对输出台站进行地磁场时变预测,最后采用残差绝对值的平均值(以下简称为绝对残差均值)来衡量两种方法的数据重构精度(姚休义等,2018)。
2.3 试验结果与对比分析
2.3.1 磁静日数据重构试验
在磁静日试验中,选取2013年1月22日为缺失数据时段,2013年1月21日为训练数据时段。采用XGBoost方法所得的试验结果如图2所示。从重构结果(图2a)来看,除去某几个时刻出现较大误差,预测数据(蓝线)与原始数据(红线)几乎完全重合,各分量重构结果与原始数据之间的相关性系数高达1,重构效果较好;从重构残差(图2b)来看,残差值几乎在0 nT处上下浮动,D,H与Z分量的绝对残差均值分别为0.056,0.043和0.057 nT,均不高于仪器的分辨率0.1 nT,预测误差相对较小。
在上述仿真试验中,时间域数据精度得到了保证,但是在重构过程中依然可能丢失某些频段的信息,因此本文又进行了快速傅里叶变换,进而从频率域对重构结果进行检验,检验结果如图3所示。可见,D和Z分量在低频和高频部分均与理论数据近乎吻合,H分量在低频部分出现了较小的误差,但是在中高频部分吻合得较好,所以在一定程度上重构结果保证了信息的完整性。
基于同样的数据,本文也进行了BP神经网络的重构试验,但是从其试验结果(图4)来看,效果较差,就整体重合度和残差大小而言,其结果不及XGBoost方法。在数据变化幅度较大的时刻,其预测数据出现了较大误差,D,H与Z分量的绝对残差均值分别达到0.53,0.75和0.42 nT,均高于XGBoost方法的预测结果。从相应的频谱分析(图5)中可以看出:D分量吻合得较好,但是相对于XGBoost较差;H分量的重构效果与XGBoost的相近,在低频段略优;Z分量无论在低频段还是高频段均显示不及XGBoost的重构结果。此外,地磁观测数据为表格数据,相较于BP神经网络,XGBoost重构方法在处理表格数据方面的优势更加突出。
2.3.2 磁扰日数据重构试验
在磁扰日试验中,选取2013年6月2日为缺失数据时段,6月1日为训练数据时段。采用XGBoost进行缺失数据重构的试验结果如图6所示。对比图2可以看出:数据重构效果(图6a)略差于磁静日,预测数据(蓝线)与原始数据(红线)存在一些不重合,但是重构数据的变化趋势和数据幅值总体上均非常接近于原始数据,重构结果依然较好;从重构残差曲线(图6b)分析,D和Z分量的残差值几乎在零线上下小幅度浮动,而H分量出现某些时刻残差较大的情况,D,H和Z分量的绝对残差均值分别为0.072,0.122和0.055 nT,与仪器分辨率0.1 nT相当,预测误差整体较小,但是相较于磁静日重构误差偏大;从地磁时变曲线(图6a)可以看出,H分量变化最为剧烈,Z分量最为平缓,因此重构效果Z分量最优、D分量次之、H分量最差。
磁扰日试验同样也进行重构效果的频谱分析,结果如图7所示。可见:D,H和Z分量在数据变化形态上保持了高度的吻合性,三个分量在低频段的重构效果相比于高频段均更优,其中Z分量在0.04 Hz附近存在一定的重构误差。
基于同样的磁扰日数据,本文又进行了BP神经网络的重构试验,其预测结果如图8所示,可见:预测数据相较于原始数据出现了较大偏差,D,H和Z分量的绝对残差均值分别达到3.57,1.05和2.33 nT,均远远高于XGBoost方法的预测结果,并且预测精度远远低于磁静日的预测水平。图9为BP神经网络重构试验的频谱分析,可见,D分量的重构效果与XGBoost相当,但是H分量和Z分量从振幅残差而言整体效果逊于XGBoost,并且Z分量的低频部分出现了较大误差。
2.4 仿真试验结果的统计与分析
本文在2013年每个月均选取了磁静日和磁扰日进行试验,并且对其进行数据统计,结果列于表1。可见:XGBoost方法在磁静日重构D,H和Z分量的绝对残差均值分别约为0.072,0.089和0.082 nT,磁扰日重构D,H和Z分量的绝对残差均值分别约为0.094,0.119和0.106 nT;BP神经网络方法在磁静日重构D,H和Z分量的绝对残差均值分别约为0.809,1.191和1.003 nT,磁扰日重构D,H和Z分量的绝对残差均值分别约为1.738,1.667和1.545 nT,因此XGBoost重构效果明显优于BP神经网络,但应用XGBoost所得的重构结果也因地磁场活动水平不同而存在差异,地磁场活动越剧烈,预测精度越低,磁静日地磁重构的绝对残差均值低于磁扰日。
表 1 采用XGBoost方法与BP神经网络方法对2013年不同季节磁静日和磁扰日地磁场日变的绝对残差均值Table 1. Mean absolute residual of geomagnetic daily variation on the magnetically quiet and disturbed days of different seasons in 2013 by XGBoost method and BP neural network method季节 月-日 磁静/扰日 XGBoost BP神经网络 ∆D/nT ∆H/nT ∆Z/nT ∆D/nT ∆H/nT ∆Z/nT 春秋季 03-16 静日 0.067 0.160 0.082 0.370 0.480 0.390 03-25 扰日 0.074 0.103 0.094 0.980 1.120 1.020 04-05 扰日 0.125 0.164 0.066 1.340 2.070 1.510 04-19 静日 0.068 0.122 0.062 0.880 0.940 0.910 09-19 扰日 0.072 0.078 0.138 0.950 1.030 1.110 09-28 静日 0.045 0.058 0.130 0.260 0.420 0.340 10-02 扰日 0.136 0.152 0.143 0.860 0.910 0.890 10-10 静日 0.067 0.075 0.054 0.350 0.550 0.510 夏季 05-01 扰日 0.127 0.142 0.102 2.890 3.010 2.970 05-30 静日 0.105 0.128 0.046 1.550 1.860 1.900 06-02 扰日 0.072 0.122 0.055 3.570 1.050 2.330 06-25 静日 0.068 0.113 0.128 2.010 2.560 1.980 07-02 静日 0.087 0.105 0.134 1.970 2.310 2.220 07-07 扰日 0.098 0.129 0.240 4.010 3.540 3.040 08-15 扰日 0.077 0.127 0.083 2.510 2.010 1.030 08-29 静日 0.063 0.096 0.076 0.980 2.680 1.870 冬季 01-22 静日 0.056 0.043 0.057 0.530 0.750 0.420 01-26 扰日 0.063 0.048 0.049 0.640 1.050 0.990 02-06 静日 0.049 0.077 0.041 0.320 0.910 0.880 02-16 扰日 0.078 0.200 0.043 1.130 1.640 1.370 11-11 扰日 0.113 0.102 0.120 0.760 0.980 0.820 11-24 静日 0.089 0.095 0.107 0.220 0.350 0.290 12-02 静日 0.035 0.043 0.068 0.270 0.480 0.330 12-09 扰日 0.098 0.126 0.137 1.210 1.590 1.460 静日均值 0.072 0.089 0.082 0.809 1.191 1.003 扰日均值 0.094 0.119 0.106 1.738 1.667 1.545 总均值 0.083 0.106 0.094 1.273 1.429 1.274 3. 结论
本文将XGBoost机器学习方法应用到地磁台站观测数据的重构研究,通过仿真试验,测试了该方法的有效性,且XGBoost的重构精度相较于BP神经网络,无论在时间域还是频率域均更高,计算结果也更加稳定。
仿真试验所得结果显示:磁静日重构残差几乎在零线上下略微浮动,D,H和Z分量的绝对残差均值均低于0.1 nT,磁扰日重构残差虽然高于磁静日,但也均在0.1 nT上下浮动。磁静日重构效果优于磁扰日,说明地磁活动性强弱影响重构效果;重构效果也与待重构地磁时变的剧烈程度有关,变化越剧烈,其重构效果越差;XGBoost重构结果具有明显的非线性特征,体现了该方法在处理非线性复杂问题方面的优势。
感谢中国地震台网中心国家地震科学中心(http://data.earthquake.cn)提供数据支持, 感谢两位审稿专家提出了诸多宝贵的建议。
-
表 1 采用XGBoost方法与BP神经网络方法对2013年不同季节磁静日和磁扰日地磁场日变的绝对残差均值
Table 1 Mean absolute residual of geomagnetic daily variation on the magnetically quiet and disturbed days of different seasons in 2013 by XGBoost method and BP neural network method
季节 月-日 磁静/扰日 XGBoost BP神经网络 ∆D/nT ∆H/nT ∆Z/nT ∆D/nT ∆H/nT ∆Z/nT 春秋季 03-16 静日 0.067 0.160 0.082 0.370 0.480 0.390 03-25 扰日 0.074 0.103 0.094 0.980 1.120 1.020 04-05 扰日 0.125 0.164 0.066 1.340 2.070 1.510 04-19 静日 0.068 0.122 0.062 0.880 0.940 0.910 09-19 扰日 0.072 0.078 0.138 0.950 1.030 1.110 09-28 静日 0.045 0.058 0.130 0.260 0.420 0.340 10-02 扰日 0.136 0.152 0.143 0.860 0.910 0.890 10-10 静日 0.067 0.075 0.054 0.350 0.550 0.510 夏季 05-01 扰日 0.127 0.142 0.102 2.890 3.010 2.970 05-30 静日 0.105 0.128 0.046 1.550 1.860 1.900 06-02 扰日 0.072 0.122 0.055 3.570 1.050 2.330 06-25 静日 0.068 0.113 0.128 2.010 2.560 1.980 07-02 静日 0.087 0.105 0.134 1.970 2.310 2.220 07-07 扰日 0.098 0.129 0.240 4.010 3.540 3.040 08-15 扰日 0.077 0.127 0.083 2.510 2.010 1.030 08-29 静日 0.063 0.096 0.076 0.980 2.680 1.870 冬季 01-22 静日 0.056 0.043 0.057 0.530 0.750 0.420 01-26 扰日 0.063 0.048 0.049 0.640 1.050 0.990 02-06 静日 0.049 0.077 0.041 0.320 0.910 0.880 02-16 扰日 0.078 0.200 0.043 1.130 1.640 1.370 11-11 扰日 0.113 0.102 0.120 0.760 0.980 0.820 11-24 静日 0.089 0.095 0.107 0.220 0.350 0.290 12-02 静日 0.035 0.043 0.068 0.270 0.480 0.330 12-09 扰日 0.098 0.126 0.137 1.210 1.590 1.460 静日均值 0.072 0.089 0.082 0.809 1.191 1.003 扰日均值 0.094 0.119 0.106 1.738 1.667 1.545 总均值 0.083 0.106 0.094 1.273 1.429 1.274 -
安振昌. 1999. 1950—2000年中国地磁测量地磁图与地磁研究[J]. 地球物理学进展,14(4):75–88. An Z C. 1999. Geomagnetic surveys and geomagnetic charts and geomagnetic studies in China for 1950−2000[J]. Progress in Geophysics,14(4):75–88 (in Chinese).
安振昌,彭丰林,刘少华,王广福. 2014. 1683—1949年中国地磁测量、地磁图和地磁模型的总考评与研究[J]. 地球物理学报,57(11):3795–3803. An Z C,Peng F L,Liu S H,Wang G F. 2014. Inspection and study on the geomagnetic survey, charts and models during 1683−1949 in China[J]. Chinese Journal of Geophysics,57(11):3795–3803 (in Chinese).
边刚,刘雁春,卞光浪,于波. 2009. 海洋磁力测量中多站地磁日变改正值计算方法研究[J]. 地球物理学报,52(10):2613–2618. Bian G,Liu Y C,Bian G L,Yu B. 2009. Research on computation method of multi-station diurnal variation correction in marine magnetic surveys[J]. Chinese Journal of Geophysics,52(10):2613–2618 (in Chinese).
卞光浪,刘雁春,翟国君,边刚,于波. 2010. 基于纬差加权法的海洋磁力测量多站地磁日变改正值计算[J]. 测绘科学,35(3):118–120. Bian G L,Liu Y C,Zhai G J,Bian G,Yu B. 2010. Diurnal geomagnetic correction with multi-observatories in marine magnetic surveying[J]. Science of Surveying and Mapping,35(3):118–120 (in Chinese).
冯志生,梅卫萍,张苏平,杜斌,居海华,杨从杰,张秀霞. 2005. FHD磁力仪Z分量分钟值日变化空间相关性的初步应用[J]. 华南地震,25(3):1–7. Feng Z S,Mei W P,Zhang S P,Du B,Ju H H,Yang C J,Zhang X X. 2005. Preliminary application of the daily-variation spatial correlation method of vertical component’s minutely value of FHD magnetometer[J]. South China Journal of Seismology,25(3):1–7 (in Chinese).
管志宁. 2005. 地磁场与磁力勘探[M]. 北京: 地质出版社: 257–294. Guan Z N. 2005. Geomagnetic Field and Magnetic Exploration[M]. Beijing: Geological Publishing House: 257–294 (in Chinese).
郭建华,薛典军. 1999. 多台站磁日变校正方法研究及应用[J]. 地球学报,20(增刊):932–937. Guo J H,Xue D J. 1999. The application and method research of magnetic diurnal calibration based on multi-station[J]. Acta Geoscientia Sinica,20(S):932–937 (in Chinese).
李超,张文辉,林基明. 2019. 基于XGBoost算法的恒星/星系分类研究[J]. 天文学报,60(2):71–80. Li C,Zhang W H,Lin J M. 2019. Research on star/galaxy classification based on XGBoost algorithm[J]. Acta Astronomica Sinica,60(2):71–80 (in Chinese).
潘星辰,姚长利,郑元满,石磊,张素琴. 2020. 海洋磁测日变校正的纬度改正方法研究[J]. 地球物理学报,63(8):3025–3026. Pan X C,Yao C L,Zheng Y M,Shi L,Zhang S Q. 2020. Study on latitude correction method of diurnal variation correction for marine magnetic survey[J]. Chinese Journal of Geophysics,63(8):3025–3026 (in Chinese).
单汝俭,金国,曾志成. 1990. 局部地区地磁日变及拟合方法研究[J]. 长春地质学院学报,20(3):315–322. Shan R J,Jin G,Zeng Z C. 1990. Study on geomagnetic diurnal variation and its fitting methods in local area[J]. Journal of Changchun University of Earth Science,20(3):315–322 (in Chinese).
吴琼,余文铖,洪海生,喻蕾,段炼,尚明远,刘哲. 2020. 基于XGBoost算法的配网台区低压跳闸概率预测[J]. 中国电力,53(4):105–113. Wu Q,Yu W C,Hong H S,Yu L,Duan L,Shang M Y,Liu Z. 2020. Probability prediction of low-voltage tripping failures in distribution transformer station areas based on XGBoost algorithm[J]. Electric Power,53(4):105–113 (in Chinese).
吴双,石宇强. 2019. 基于BP网络与XGBoost的质量控制方法研究[J]. 制造业自动化,41(12):12–17. Wu S,Shi Y Q. 2019. Research on quality control method based on BP network and XGBoost[J]. Manufacturing Automation,41(12):12–17 (in Chinese).
徐文耀. 2003. 地磁学[M]. 北京: 地震出版社: 1–45. Xu W Y. 2003. Geomagnetism[M]. Beijing: Seismological Press: 1–45 (in Chinese).
徐行,廖开训,陈邦彦,王建革. 2007. 多台站地磁日变观测数据对远海磁测精度的影响分析[J]. 海洋测绘,27(1):38–40. Xu X,Liao K X,Chen B Y,Wang J G. 2007. The effect analysis of the observed diurnal magnetic variation from multi-stations on the accuracy of marine magnetic survey[J]. Hydrographic Surveying and Charting,27(1):38–40 (in Chinese).
姚法章. 1988. 订正法在地磁绝对观测中的应用[J]. 地震地磁观测与研究,(6):35–38. Yao F Z. 1988. The application of correction method in geomagnetic absolute observation[J]. Seismological and Geomagnetic Observation and Research,(6):35–38 (in Chinese).
姚休义. 2015. 地磁台站观测异常识别与数据重构技术研究[D]. 北京: 中国地震局地球物理研究所: 88–99. Yao X Y. 2015. Method of Artificial Electromagnetic Disturbances Identification and Data Reconstruction[D]. Beijing: Institute of Geophysics, China Earthquake Administration: 88–99 (in Chinese).
姚休义,滕云田,杨冬梅,姚远,陈俊. 2016. 地磁观测数据重构技术研究[J]. 地震学报,38(6):878–888. Yao X Y,Teng Y T,Yang D M,Yao Y,Chen J. 2016. On reconstruction technique of geomagnetic observation data[J]. Acta Seismologica Sinica,38(6):878–888 (in Chinese).
姚休义,滕云田,杨冬梅,姚远. 2018. 基于神经网络的地磁观测数据重构研究[J]. 地球物理学报,61(6):2358–2368. Yao X Y,Teng Y T,Yang D M,Yao Y. 2018. Reconstruction of geomagnetic data based on artificial neural network[J]. Chinese Journal of Geophysics,61(6):2358–2368 (in Chinese).
张向宇,关永贤,张锡林. 2016. 回归分析法在日变数据推算中的应用[J]. 物探与化探,40(3):603–608. Zhang X Y,Guan Y X,Zhang X L. 2016. The application of regression to estimating geomagnetic data[J]. Geophysical and Geochemical Exploration,40(3):603–608 (in Chinese).
朱兆才. 1989. 空间相关性分析在地磁观测研究中的应用[J]. 地震地磁观测与研究,(5):44–49. Zhu Z C. 1989. Spatial correlation analysis in the application of the geomagnetic observational studies[J]. Seismological and Geomagnetic Observation and Research,(5):44–49 (in Chinese).
Bergen K J,Johnson P A,de Hoop M V,Beroza G C. 2019. Machine learning for data-driven discovery in solid earth geoscience[J]. Science,363(6433):1–10. doi: 10.1126/science.aau0323
Chen T Q, Guestrin C. 2016. XGBoost: A scalable tree boosting system[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: Association for Computing Machinery: 785.
Friedman J H. 2001. Greedy function approximation:A gradient boosting machine[J]. Ann Stat,29(5):1189–1232.
Hajian A, Styles P. 2018. Application of Soft Computing and Intelligent Methods in Geophysics[M]. Switzerland: Springer International Publishing: 3–193.
Kohavi R. 1995. A study of cross-validation and bootstrap for accuracy estimation and model selection[C]//Proceedings of the 14th International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann Publishers Inc: 1137–1143.
Pelikan M,Sastry K,Goldberg D E. 2002. Scalability of the Bayesian optimization algorithm[J]. Int J Approxim Reason,31(3):221–258. doi: 10.1016/S0888-613X(02)00095-6
Xia Y F,Liu C Z,Li Y Y,Liu N N. 2017. A boosted decision tree approach using Bayesian hyper-parameter optimization for credit scoring[J]. Exp Syst Appl,78:225–241. doi: 10.1016/j.eswa.2017.02.017
-
期刊类型引用(5)
1. 于文强,李厚朴,刘敏,宋立忠. 基于混沌理论、变分模态分解和长短期记忆网络的地磁变化预测方法. 地震学报. 2024(01): 92-105 . 本站查看
2. 于文强,李厚朴,秦清亮,宋立忠,王志远. 混沌RBF神经网络的地磁变化场预测模型. 大地测量与地球动力学. 2023(03): 308-312 . 百度学术
3. 汪再如. 机械零件加工质量预测及优化模型构建研究——基于机器学习算法. 贵阳学院学报(自然科学版). 2023(01): 91-96 . 百度学术
4. 单维锋,闫非石,刘海军,李志扬,刘高川,陈俊. 基于深度神经网络的地磁观测数据高压直流输电干扰事件识别. 地球物理学报. 2023(04): 1575-1588 . 百度学术
5. 单维锋,李志扬,陈俊,刘海军,张秀霞,邢丽莉,胡秀娟,夏庆新,夏金铸. 应用卷积神经网络和自注意力机制识别地磁场干扰事件. 地震地磁观测与研究. 2022(05): 49-63 . 百度学术
其他类型引用(4)