地震学报  2009, Vol. 31 Issue (3): 342-346
基于概率统计的地震事件公报评估算法
王海军 , 王燕, 王伟    
(中国北京100085禁核试北京国家数据中心和放射性核素实验室)
摘要:给出一种基于概率统计的地震事件公报评估算法.选择事件的发震时间、震中经纬度构造特征函数.当特征函数为正态分布时计算事件匹配概率,选择匹配概率大于90%的事件为匹配事件.将该算法应用于国际数据中心(IDC)自动处理与人工分析公报的比较分析.相对于人工分析结果,IDC数据自动处理的匹配率约为79%,误检率约为52.3%.该算法可应用于地震事件公报的日常对比分析、台网监测能力分析、数据自动处理结果评估等领域.
关键词地震事件    事件公报    评估    概率    
Seismic event bulletin evaluation based on probability analysis
Wang Haijun , Wang Yan, Wang wei    
(CTBT China Beijing National Data Centre, Beijing 100085,China)
Abstract: A seismic event bulletin evaluation algorithm based on probability analysis was proposed. An eigenfunction is constructed with origin time, latitude and longitude of the event. Suppose the eigenfunction obeys a normal distribution, then the event matching probability could be calculated. The events with matching probability greater than 90% were selected as the matching events. Initial application in comparison with IDC SEL3 and IDC REB shows that for automatic processing the event detection ratio is nearly 79% and false detection ratio is about 52.3%. The agorithm developed in this study can be used for routinely comparing event bulletins, and can also be applied to network monitoring capability analysis and automatic data processing evaluation.
Key words: seismic event    event bulletin    evaluation    probability    
引言

地震事件公报是地震监测与分析的重要结果之一,它给出了地震事件的发震时间、震中、震级、定位误差椭圆等信息,既可以用来记录地震事件,也可以用来分析和评估台网监测能力,是地震学研究中很有价值的参考资料.不同类型的地震台网监测能力是不同的,其监测能力的大小可以直接反映在事件公报中.选择监测能力强的台网给出的事件公报为标准,其它台网给出的事件公报与之比对,可以快速直观地了解其它台网的监测能力.事件公报比对还可应用于监测数据自动处理能力评估.地震监测数据汇集到数据中心之后,通常先进行自动处理,在自动处理的基础上进行人工分析(SAIC,1999).由于地震记录的复杂性和自动处理算法的不完备,使得系统自动处理结果不可避免地存在误检和漏检的事件(Jia Y,2006,私人通讯).以人工分析结果为标准,对比自动处理结果,可用来检测和评估系统自动处理能力,为系统数据自动处理算法和参数的优化与改进提供依据.

对于相同的事件,不同机构给出的分析结果略有差别,即使在同一个数据处理系统中,不同分析人员的分析结果也不可能完全一样.事件公报对比时,关键问题是如何定义匹配事件.如果两个事件的主要特征参数(发震时间、震中经纬度)基本一致,就认为是相同事件或匹配事件.常见的判别准则是,如果两个事件的发震时间及震中位置之差在给定的范围内,则认为是匹配事件,这种方法称为硬门限法.实际应用中,在符合要求的时窗内如果有多个地震事件,采用常用的硬门限法很难筛选匹配事件;比较自动处理与人工分析结果时,采用硬门限法有时会筛选掉真实的地震事件.因为,有的自动处理给出的事件,虽然其定位参数与人工分析结果相比误差大于硬门限的阈值,但这样的事件经过人工修订后定位结果明显改善(Jia Y,2006,私人通讯).为了真实地了解自动处理性能,这样的事件应该视为匹配事件.针对硬门限法在事件公报比较时的不足,本文给出一种基于概率统计的事件公报评估方法.

1 基于概率论的事件公报评估算法

不同事件公报对比时,首先是找出匹配事件,然后才能统计出漏检或误检事件.事件是否匹配是一个模糊概念,两个事件的主要特征参数相差多少才可以表明是同一个事件没有严格的限制.因此,利用概率来判断事件是否匹配是适合的(Newald,2005).

事件的主要参数有发震时间、震中经纬度、震级、震源深度、事件定义震相数目等.对于同一个事件,由于监测台站的不同,不同机构用于计算的事件定义震相数目和给出的震级亦不同.震源深度的计算需要深度震相,有的监测台网可能没有记录到清晰的深度震相而无法计算震源深度.考虑到这些因素,选择事件发震时间(t)、震中纬度(φ)和经度(λ)作为观察值,构造序列eteφeλ:

式中,taφaλa分别表示待分析事件公报中的发震时间、震中纬度和经度;trφrλr分别表示标准事件公报中的事件发震时间、震中纬度和经度;i=1,2,…,N×Mj=1,2,…,Nk=1,2,…,M.N是待分析事件公报中的事件总数,M是标准事件公报中的事件总数.以事件发震时间构造的误差序列et为例,假设et服从正态分布N(μ,σ2),其概率密度函数是(数学手册编写组,2002):

式中,μσs2分别是et的均值和方差.比较两个不同事件的发震时间时,时间差越小则认为这两个事件匹配的可能性越大. 若第i个事件对的发震时间之差为ti,计算

表示以发震时间之差为观察值时两个事件的匹配概率. 显然,pti越大表示两个事件的匹配程度越高.类似地,假设事件位置纬度和经度的误差序列eφeλ服从正态分布,且第i个事件对的位置纬度和经度之差分别为φiλi,计算

构造联合概率函数

pi表示第i个事件对总的匹配概率,pi越大表示第i个事件对的匹配程度越高. 若两个事件匹配概率大于90%,则认为两个事件匹配.

应用式(5)比较全球事件公报时,对于经度180°附近的事件,不同事件公报给出的震中经度有时在180°经线左右两侧.经度的范围为0-180°和0-180°,分别表示东半球和西半球.这时按照式(1)计算的震中经度之差非常大,事件匹配时就会筛选掉这样的事件.采用事件震中位置的相对距离代替震中经度和纬度,就可以避免类似的边界问题.

事件公报对比时,定义

1 )事件匹配率

式中,M是标准事件公报中的事件总数,J是待分析事件公报中筛选出的匹配事件总数.

2)事件漏检率

3)事件误检率

式中,N是待分析事件公报中的事件总数.

以上是事件公报评估中常用的3个重要统计参数.有了匹配事件对,可以进行很多事件特征参数的对比分析.比如,自动处理与人工分析结果对比时,可以通过统计匹配事件发震时间或震中位置的相对差,了解数据自动处理性能,为数据自动处理算法和参数优化提供评估标准.

2 应用

收集IDC自动处理公报SEL3和人工分析公报REB,利用文中给出的算法,对比分析了IDC SEL3和IDC REB中的事件,以此了解IDC数据自动处理性能. 表 1是实验中IDC公报的有关信息和分析结果. 图 1是实验1中计算的事件匹配概率二维显示结果,图 2是实验1中匹配事件的发震时间和震中位置相对差的统计结果.

表 1 IDC SEL3与IDC REB事件公报对比分析结果 Table 1 Statistic result of IDC SEL3 compared with IDC REB

图 1 事件公报比较时的匹配概率横坐标(x)表示待分析事件,纵坐标(y)表示标准事件 Fig.1 A 2-D plot of matching probability x denotes test events and y st and s for reference events

图 2 匹配事件特征参数统计分析 (a)发震时间相对差的统计直方图;(b)发震时间相对差的累积量统计;(c)震中位置 相对差的统计直方图;(d)震中位置相对差的累积量统计 Fig.2 Statistic analysis of feature parameters for matching events (a)Histogram of relative error of the origin time;(b)cumulative statistics for relative error of origin time;(c)histogram of relative error of epicenter location;(d)cumulative statistics for relative error of epicenter location

实验中筛选匹配事件的匹配概率阈值为0.9. 由表 1可知,IDC SEL3的事件匹配率约为79%,说明对于IDC REB中的事件,IDC自动处理能检测到其中约79%的事件,IDC自动处理的漏检率约为21%,误检率约为52.3%. 这与英国NDC对IDC自动处理性能的评估结果基本一致(Bowers,2008).自动处理中事件的定位准确度可用匹配事件的发震时间、震中位置相对于人工分析结果差的统计值来衡量. 表 1给出了匹配事件的发震时间、震中位置相对差的累积量中90%处的统计值.

这种算法基于概率统计来筛选匹配事件,利用样本的特征值构造特征参数序列,自动计算特征参数序列的统计分布特征值,要求公报中必须有足够多的事件.若事件数目太少,则无法有效地计算特征参数序列的分布特征值;若事件数目过多,则会导致计算量显著增加.对于IDC公报的比较,最好选择1天至1个月的事件公报进行对比分析.

3 讨论与结论

利用概率统计的方法评估事件公报,能够准确有效地筛选匹配事件,客观地评价事件公报质量,并能够应用于台网监测能力分析和数据自动处理性能评估.匹配概率的计算需要足够多的样本进行统计,但当事件数目过多时,会增加计算量.因此,如何在大样本分析中提高计算速度和节省计算资源,是该算法需要继续改进和优化的地方.

参考文献
[1] 数学手册编写组. 2002. 数学手册[M]. 北京: 高等教育出版社: 816-820.(1)
[2] Bowers D. 2008. UK NDC experience[C/OL]//30th Session of Working Group B, Feb.12-19. Vienna.(1)
[3] Newald P. 2005. BULCMP Software User Tutorial[M]. Vienna: CTBTO: IDC/BULCMP/SUT: 2-22.(1)
[4] Science Applications International Corporation (SAIC). 1999. IDC processing of seismic, hydroacoustic, and infrasonic data[C]//IDC Documentation. 2-6[2008-02-01].https://www2.ctbto.org.2008 .(1)