找回密码
 注册

QQ登录

只需一步,快速开始

查看: 2318|回复: 0

【科技进展】自然灾害领域科技研究的发展现状与趋势分析

[复制链接]
发表于 2023-2-19 09:19:13 | 显示全部楼层 |阅读模式
摘要:自然灾害对人类生存和发展具有极大的威胁,在过去四十年里,对自然灾害进行的研究越来越完善与深入。随着科学技术的进一步发展和环境的复杂变化,对研究领域进行回顾总结,并探讨新的研究热点和趋势成为一项关键问题。本研究利用文献计量学,对来自Web of Science中的25969篇出版物进行了作者、机构、国家/地区、期刊、学科、关键词和摘要的信息提取与统计分析,并通过机器学习对研究热点进行了讨论。结果表明:1)自然灾害相关的出版物数量和增长速率均在不断上升;2)Pradhan,Biswajeet、Chinese Academy of Sciences、美国、“NaturalHazards”期刊分别是各项分析中出版物数量最多的贡献者,Geosciences Multidisciplinary是占比最多的学科;3)关键词分析表明地震、滑坡和洪水是自然灾害研究的核心内容,而近年来气候变化、防灾减灾和应急管理得到越来越多的重视;4)LDA模型得到的主题中,频率最高的是“Mechanismand simulation”和“Risk Assessment”,而“Droughtand water hazards”和“Machine Learning”发展迅速。

关键词:自然灾害;文献计量分析;Latent Dirichlet Allocation;VOSviewer

       研究成果发表在美国土木工程师学会(ASCE)旗下SCI收录的英文期刊Natural Hazards Review上,IF=4.2, 通迅作者为国家自然灾害防治研究院地质灾害研究中心许冲研究员,第一作者为黄远东硕士研究生。详见:Huang Y, Xu C*, Zhang X, Li L, Xu X (2023) Research in the field of natural hazards based on bibliometric analysis. Natural Hazards Review, 24(2): 04023012.

原文链接:https://ascelibrary.org/doi/10.1061/NHREFO.NHENG-1739

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w1.jpg

1.引言

自然灾害(natural hazards)是指由自然环境产生,可能造成生命伤亡、其他健康影响、财产损失、社会和经济混乱以及环境退化等后果的过程与现象。而如果实际造成了以上后果,则该次事件称之为灾难(disaster)(Xu et al. 2021)。自然灾害种类繁多,涉及自然界的多个方面,如地质灾害、地震、极端天气、海洋变化、洪水、干旱、野火、空间灾害等。自然灾害破坏力巨大,例如2010年海地地震,造成22万人以上死亡(Hou et al. 2011),2008年缅甸热带风暴造成13万以上人员死亡(Webster 2008)。此外自然灾害还具有关联性与并发性,例如2004年由Ms 9.1级地震引发的印度洋海啸,造成22万以上的人员死亡(Okal 2015)。2008年汶川地震中,约2万人的死亡与地震所触发的地质灾害直接相关(Yin et al. 2009)。

根据相关研究统计,在2000-2019年间,EM-DAT数据库共记录到7348起自然灾害,造成每年平均6万人死亡(UN Office for Disaster Risk Reduction 2020)。迄今为止,国际组织、各国政府、相关研究机构和研究人员都对自然灾害展开了深入与全面的研究。例如在条约法规方面,联合国分别于1994、2005和2015举办的三次世界减灾大会,并推出了《2015-2030年仙台减灾框架》(UN Office for Disaster Risk Reduction 2015)。在灾害机理方面,对各类自然灾害进行模拟,研究灾害过程,包括地震(Yamada et al. 2016)、崩塌(Li et al. 2017)、海啸(Harig et al. 2008)等。在数据统计方面,收集统计各类灾害数据,建立完善的数据库,研究其规律(Xu et al. 2015; Huang et al. 2021)。在监测预警方面,利用遥感与实地监测仪器等设备与技术,在灾害发生前,对危险人群进行预警信息发布(Fan et al. 2019b; Melet et al. 2020)。在风险评价方面,利用机器学习模型结合大数据进行风险区划(Tehrany et al. 2015; Shao et al. 2019)。在城市建设规划方面,提倡韧性城市的概念,增强抗灾减灾能力(Kruse et al. 2017; Liu et al. 2021)。以上仅提及了部分研究方向。可以看出,对于自然灾害的研究,已经取得较为丰富的成果。但是随着全球变暖、人类活动频繁和社会发展迅速等因素,世界各地自然灾害的规模、强度和频率都在逐渐加剧,造成的人员伤亡和经济损失也在不断增加。因此,自然灾害是人类生活与社会发展所必须面临的难题。对于自然灾害的研究,必须一直持续且不断地深入。

在此背景之下,挖掘研究领域的热点,探索研究的趋势是一项重要的任务。因此我们引入了文献计量学,一门通过数学统计对各类知识载体进行分析,从而探索学科领域的发展特征、热点和趋势的科学。文献计量分析此前已经被应用于自然灾害领域,Barnes et al. (2019)以自然灾害、灾害管理和模拟为主题,进行了文献的检索和计量分析,其中不同灾害类型的时空分布是其研究中的重点。Fan et al. (2020)的研究更偏向于关键词演变和地区之间研究的差异。随着研究领域的发展和研究目的不同,已有研究都存在一些待完善之处。例如上述研究都缺乏更完整的图谱或者关系网络分析,并且数据来源更偏向直接统计获得而没有对信息进行更进一步的分析和挖掘。此外,随着机器学习的发展,自然语言处理给文献计量分析带来了创新与提升,在此之中,隐含狄利克雷分布,即LDA主题模型(LDA),在自然科学、形式科学和社会科学中均得到广泛应用(Li et al. 2021)。甚至有研究针对LDA模型的应用开展了文献计量分析(Garg et al.2022),这足以说明LDA模型的重要性。

因此本研究,以Web of science核心数据库为检索源,以检索得到的自然灾害相关文献作为研究对象,采取文献计量软件与机器学习结合的方法。研究目的在于:(1)对自然灾害领域的研究进行总结;(2)为寻找实力较强的研究合作对象提供一定的帮助;(3)探讨研究热点与发展趋势,为研究者提供参考;(4)为今后该领域研究目标的凝练和寻找后续研究的突破口等工作提供科学判断的依据。

2. 数据与方法

2.1. 数据

本文数据来源于WOS数据库核心合集,WoS是目前全球研究人员广泛认可的文献数据库之一,与其他数据库相比,WoS具有更准确的期刊分类体系(Wang and Waltman 2016)。此外,WoS数据库在引文分析方面与基本科学指标和期刊被引报告有着密切的联系(Archambault et al. 2009)。这是我们选择的主要原因。

由于WOS数据库具有特殊的检索规则,以“natural hazard”为主题进行检索,会得到大量无关的出版物。因此我们将检索条件设置如下:((((TS=("nature disaster$")) ORTS=("nature hazard$")) OR TS=("natural disaster$")) ORTS=("natural hazard$")) NOT PY=(2022),检索得到25969篇出版物。利用WOS自带的导出功能,将全部记录导出为''txt''格式。内容包括每一篇出版物的标题、关键词、摘要、作者、年份、学科和来源期刊等。H因子自提出以来(Hirsch 2005),被广泛用于评价作者或团体的学术影响力。因此本研究还利用WOS自带的统计功能,统计各计量单位的h-index(H因子),写入研究中建立的数据库。
2.2. 方法

在本研究中,我们采取了VOSviewer软件和Python机器学习相结合的方法。软件的优势在于其操作便捷,且可视化能力强。而Python与机器学习的优势在于,可以根据研究需要,进行灵活地调整与编码,从而获得软件所无法得到的信息。本研究主要分为三部分。

首先,我们将文本文件导入VOSviewer软件,利用软件功能进行统计。分析内容包括年发文量、被引次数、所属作者和机构、国家或地区、来源期刊、学科类别和关键词。其中有两项内容需要单独说明,其一是学科类别。尽管文本字段中包括学科类别,但是在软件中却没有对应的分析功能。因此我们使用Python,将学科类别的标识简写替换为软件所能识别的其他标识简写(例如关键词、作者等),从而可以成功得到学科方面的信息。其二是关键词分析,为突出其随时间变化的情况,我们采取时间切片进行分段分析。最后我们将所有统计结果转换为表格,统计并计算出总发文量(TP)、被引次数(TC)、单篇平均被引次数(AC)和H因子。以上述参数作为判断指标,综合评价其学术影响程度。在合作关系方面,我们选择最密切合作对象(CCO)和总合作对象数量(TNC)作为指标。

现有的文献计量分析,如引言所提到,在研究热点、趋势和分类方面均有待完善,这也正是本研究的目的之一。本研究认为,仅仅对关键词进行统计,并不能完全体现研究的侧重内容。因此本文采用了Latent Dirichlet allocation(LDA)模型进行分析。这是一种主题建模方法,用于数据挖掘、潜在数据发现以及分析文档之间的关系(Jelodar et al. 2019)。该方法被广泛应用于文档的主题挖掘,例如大量新闻文本的研究(Jacobi et al. 2016)。对某一领域内相关文章进行LDA模型分析,将有助于对研究内容进行进一步分类,阐述其知识结构和研究趋势(DiMaggio et al. 2013)。

本研究的另一方面则是通过LDA模型进行研究热点和趋势的分析。主要流程如下:1)首先利用正则表达式提取出文本文件中每一篇出版物的摘要部分;2)基于相关信息资源生成停用词表,主要为一些摘要中出现的无意义词汇,例如一些连接词、介词等;3)在Python中调用gensim包构造LDA模型,进行数据预处理(停用词去除、词干提取和词性还原)后输入摘要文本进行分析;4)以主题一致性为判断标准,确定一致性最高的主题数量为最佳,设置每个主题显示前10个最相关特征词汇,导出结果;5)对结果进行人工判别,继续提取意义不大的词汇进入停用词表再重新分析,直至主题与特性词汇表的效果达到满意程度(主题一致性不再明显变化,特征词汇符合研究常识);6)根据先前已经完成的分时段关键词统计表,对同时段内各个主题的特征词汇进行统计,得到各个主题在不同时间分段内的变化。

最后是进行LDA模型和VOSviewer软件的结合,正如此前提到的,软件具有很优秀的可视化效果,因此将LDA模型的结果通过软件实现可视化,对于信息的直观性表达是非常有利的。我们的操作流程如下:1)在导出txt文件时,我们是以500篇出版物为一个文本文件,因此我们首先使用代码进行分割,使得单个出版物生成一个文本文件;2)按照LDA结果,统计各主题之间,共同出现特征词汇的文档数量作为判断指标;3)将统计结果转为VOSviewer所能读取的文件格式;4)通过软件实现LDA结果的可视化。

3. 结果

3.1. 发文量趋势

最早收录于WOS核心数据库的出版物时间为1982年,此后出版物的数量一直处于增加状态。并且2014年之后,增长速度进一步突升,该趋势持续至今(图1)。该现象表明自然灾害领域的研究在不断发展与深入。为了分析发文量变化与时间增长的关系,我们将1982-2021年对应为数字1-40,并作为自变量x,而将每年的发文量作为因变量y,通过SPSS软件进行多项式拟合。拟合结果为:

y= -13.4 + 13.46 x –1.77 x2 +0.08 x3

该拟合多项式的R2为0.98,说明多项式拟合效果较好,年发文量与时间关系密切,并且根据该多项式可以判断,2022年预计发文量达到3077篇。

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w2.jpg

图1  年出版物数量趋势
3.2. 作者

研究过程中,我们发现从WOS数据库中导出的作者信息存在一定误差,作者的名并不完整,通常会以首字母简写的形式显示,只保留完整的姓氏。因此不同作者可能会被简写成相同的样式。此外,不同期刊的信息格式并未完全统一,这会导致同一作者的记录方式也可能不同。因此本文在统计时,通过字段比对与作者机构比对的方式进行校正,尽量减少误差。

表1列出了发文量排名前20的作者。25969篇共涉及到70000多位作者。发文量最高的为Pradhan, Biswajeet(62)、Zhang, Jiquan(51)和Laplante,David P. (47)。而在总被引次数方面,Pradhan, Biswajeet(4725)、Galea, Sandro(4544)和Cutter, Susan L.(4424) 均在4000次以上,远高于其他研究者。

在单篇平均被引次数方面,Cutter,Susan L.以147.5次为最多,Singh,Vijay P.和Galea, Sandro分别为129和105.7次。Pradhan,Biswajeet的H因子为最高,达到34,其次为Fuchs,Sven和Galea, Sandro,两者均为26。

Table 1 发文量排名前20的作者列表

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w3.jpg

Note:TP, TC, AC, CCO and TNC分别代表总发文量、总被引量,单篇平均被引次数,最密切合作对象,总合作对象数量。

在作者合作人数上,Laplante,David P.为最高,达到46人,其次为King, Suzanne和Elgbeili,Guillaume,分别为34和25人。图2为作者共现网络图,相同颜色的形状代表聚类为一类,节点间的连线代表了作者之间关联的密切程度。可以看出,上文提到的具有较高学术影响力的作者,大部分都拥有自己的聚类,并且是其中的核心人物。此外连线越多代表了合作次数越多。而较典型的聚类中,不仅聚类内部的连线密集,与其他聚类间的连线也较多。这充分说明了学术合作与交流的重要性。

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w4.jpg

图2 作者共现关系网络图
3.2. 机构

机构分析中,机构之间存在的隶属或包含关系是需要考虑的。例如UniversityOf Chinese Academy Of Sciences直属于Chinese Academy Of Sciences,那么两者之间必然会存在较多的重复出版物。因此在研究过程中,我们对这类机构进行整合,在统计表中放置于上级机构的下一行,并以斜体表示。研究结果如表2所示。出版物数量方面,ChineseAcademy Of Sciences以604篇的记录远高于其他机构,之后的UniversityOf California System和State University System OfFlorida则有470和366篇出版物记录,两者均属于美国。总被引量统计显示,UniversityOf California System被引次数最多,为29124次,。其次为UniversityOf London(23700)和ColumbiaUniversity(16207)。ChineseAcademy Of Sciences发文量最多但是总被引量为8941,与上述机构存在一定的差距。单篇平均被引次数统计显示UniversityCollege London单篇平均被引次数最多,为102.8次,其次为ColumbiaUniversity(94.78)。而UniversityOf Melbourne总发文量仅139篇,但是单篇平均被引次数为第三,达到84.37。

H因子方面,University Of California System的H因子最高为72,其次为UniversityOf London(62)和Helmholtz Association of GermanResearch Centres(51)。在合作关系分析中,合作机构数量最多的机构为UniversityOf California System,与1337个机构有合作,其次为ChineseAcademy Of Sciences(1303)和UniversityOf London(1188)。

机构的规模与学术影响力同样具有联系,通过WOS数据库可以在线得到机构内的发文人数,近似看做研究人员数量,用以评估机构的规模。必须承认的是,机构之间的规模远不能相提并论。UniversityOf California System为研究人员最多的机构,达到3119人,ChineseAcademy Of Sciences位居第二,达到2962人。这两个机构的人数远高于其他机构。值得一提的是,在发文量前10的机构中,BeijingNormal University是人数最少的机构,为691人,远低于其他9个机构。从这一点来看,BeijingNormal University中自然灾害的研究者更为集中。

Table 2 发文量排名前20的机构列表

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w5.jpg

Note:TP, TC, AC, TNC and NOR 分别代表总发文量、总被引量,单篇平均被引次数,总合作对象数量和机构研究人员总数。

图3反映出,机构之间具有明显的聚类,并且与其所属国家/地区具有密切联系。例如蓝色聚类中,CAS是最核心的机构,而与之关联密切的机构有UCAS、Wuhan University、TsinghuaUniversity等,均同属中国。红色聚类以Texas A M University System为代表,其中多为美国的研究机构。而黄色聚类和绿色聚类则分别对应了东南亚区域和欧洲。

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w6.jpg

图3 机构共现关系网络图

3.3. 国家/地区

正如我们已经提到的,国家与地区的统计结果与机构关系密切,但是依然能反映不同的信息(表3)。在总发文数量上,呈现出三个分段。美国以7366篇出版物位于总发文量第一,而排名第二的中国为3954,远低于前者,再之后则是发文量1612的英国,而这一现象并未在机构分析中出现。我们认为这与机构数量有关。美国的机构数量为5419,而中国为3309,可以看出已经存在一定差距,而英国为2647。而这一数据,可以侧面反映国家/地区对于自然灾害领域的重视程度,机构数量越多,那么说明该国家/地区对于自然灾害领域越重视。

在总被引次数上,美国最高,达到209185次,其次是英国(52470)和中国(49973)。而在单篇平均被引次数上,Sweden、Russia和Netherlands位居前三,分别为46.67、43.62和43.5。而H因子方面则是美国(178)、英国(94)和澳大利亚(84)。

从合作数量来看,最多的是美国和澳大利亚,合作的国家/地区数量均达到152。然后是英国,与137个国家或地区存在学术合作关系。在发文量前30的国家或地区中,与美国合作最密切的达到21个,其次为意大利,达到4个,中国与澳大利亚均第三位。美国的最密切对象则是中国,在该领域的研究中,两者合作的出版物为474篇。而另外一项指标显示,加拿大、奥地利和巴基斯坦的合作率最高,分别为24.13%、21.37%和21.18%,三者的最密切合作对象分别为美国、德国和中国。

Table 3 发文量前20的国家/地区

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w7.jpg

Note:TP, TC, AC, CCO and TNC分别代表总发文量、总被引量,单篇平均被引次数,最密切合作对象,总合作对象数量。

在国家及地区之间的合作关系研究中,需要明确出版物所属的第一单位,从而分清楚出版物的所属权与合作关系。这项信息是无法直接得到,因此我们通过编写代码,对所导出的文本文件进行了信息提取,以列出的第一位作者的信息来判断出版物的所属国家/地区。我们根据完善的信息绘制了弦图(图4)。图4反映了表3中所出现的国家及地区之间的合作关系。其中箭头来源代表了第一作者所属国家/地区,而箭头指向的是其他合作的对象。可以看出,中国、美国和英国是国际合作中最重要的国家。并且存在一个有趣的现象,那就是每个国家/地区的出版物记录中,箭头来源和箭头指向的比例是大致相同的,其含义为,在于该国家相关的出版物中,第一作者来自该国家/地区的出版物和第一作者非该国家/地区的出版物数量近似持平。

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w8.jpg

图4 国家/地区合作关系弦图
3.4. 期刊

期刊的文献计量分析不仅可以体现期刊在研究领域内的学术影响程度,同时对于研究者的投稿选择也具有一定的帮助。考虑到出版物的来源信息较为复杂,。因此我们这部分的研究中,只选择了期刊上发表的论文进行分析(表4)。25969篇出版物共来自于3547篇期刊。总发文量最高的的期刊为Natural Hazards,在所有出版物中有963篇出版物来源于该期刊,随后是International Journal Of Disaster Risk Reduction(668)和Sustainability(361)。总被引次数上,从高到低的前三位分别是Natural Hazards(23092)、Natural Hazards And Earth System Sciences(10244)和International Journal Of Disaster Risk Reduction8637。每篇篇平均被引次数的结果显示Journal Of HydrologyGeomorphologyRisk Analysis单篇平均被引次数最多,分别为71.42、64.74和44.82。

影响因子值(IF)是国际上通用的期刊整体评价指标(Garfield1955)。在本研究中,选取了Journal Citation Report中近五年的平均值,统计结果显示影响因子最高的三篇期刊分别为Science Of The Total Environment(7.842)、Journal Of Hydrology(6.033)和Remote Sensing(5.353)。而发文量较多的前三类期刊的影响因子都相对较低。这说明自然灾害研究在科学领域还需要进一步被重视。H因子方面,Natural Hazards再次以66的最高值排在第一。整体上来看,Natural HazardsNatural Hazards And Earth System SciencesInternational Journal Of Disaster Risk Reduction是自然灾害领域中具有代表性的期刊。此外在Journal Of HydrologyGeomorphology等期刊上,同样具有非常优秀权威的论文值得参考与引用。

Table 4 发文量前20的期刊列表

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w9.jpg

Note:TP, TC, AC 分别代表总发文量、总被引量,单篇平均被引次数。
3.5. 学科

WOS核心数据库中,对于每一篇出版物都会进行类别的划分,我们在研究中将此视作学科类别并统计了发文量最多的国家/地区和机构。由于排版和机构名的原因,我们将机构进行简写。在上文中已经提到了部分机构的缩写,因此在我们仅在表5的批注中对首次出现的机构名的缩写进行了解释。必须说明的是,这些学科均是来自与自然灾害相关的出版物,而并非整体研究领域的水平。从表5中可以看出,从国家/地区层面上来分析,美国和中国是最具代表性的国家,在所有学科的发文量排名中,这两个国家均位居前二。而从机构层面来看,CAS是最核心的机构,但并非在每个学科都是最顶尖水平。例如在EngineeringCivil学科中,SUSF则是发文最多的机构。PublicEnvironmental Occupational Health方面,发文量前三的机构均来自美国。此外还有一些专业性较强的机构,例如JHC在PublicEnvironmental Occupational Health方面排名靠前,NASA在RemoteSensing方面非常突出。

Table 5 出版物数量最多的前10类研究学科

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w10.jpg

Note:WC, TP, LERU, CDC, USDOE, NASA, WB, JHU, BUPT and NENU 分别代表 web of science 分类, 总发文量,欧洲研究型大学联盟, 美国疾病控制预防中心, 美国能源部, 科罗拉多州立大学,美国航空航天局, 世界银行, 约翰斯·霍普金斯大学, 北京邮电大学, 东北师范大学。
3.6. 关键词

关键词分析方面,进行分析之前,将同义词进行合并,例如单词的不同形式、词义相似的术语。此外手动剔除了一些尽管出现频繁但是对于研究趋势分析作用较小的词汇,例如"disaster"、"hazard"等,因为这类词汇和我们的检索式语义高度重合。

将时间划分为1982-2006、2007-2011、2012-2016和2017-2021。统计结果(表6)显示,关键词总数目随着时间变化而不断增加,1982-2006的出版物涉及到的关键词为331个,而2017-2021年出版物的关键词数量为994个。从这一现象来看,我们认为这是自然灾害领域的研究不断发展深入,学科交叉与融合的体现。

Table 6 各时间段内出现频率最高的前20个关键词

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w11.jpg

我们基于表6对关键词进行了解释。首先是在四个时间段内均有出现且频率增长稳定的关键词。“earthquakes”在所有时间段内都保持较高的频率,这是因为地震是最具有破坏力的自然灾害之一,并且近40年以来,全球发生的大型地震次数较多。因此针对地震灾害的研究是非常重要的。例如Avouacet al. (2006)对2005年克什米尔地震的地震波形进行了分析,Kanedaet al. (2008)则以地表破裂和构造意义为研究对象。除了对于地震本身机制的研究外,地震触发的次生灾害(尤其是滑坡)也是另一项重点研究方向。例如Xu etal. (2014)和Gorum et al. (2010)均对2008年汶川地震所触发的同震滑坡进行了空间分布规律分析,此外较为典型的事件还有2015年尼泊尔地震(Xu etal. 2017a; Tsou et al. 2018)和2018年北海道地震(Yamagishiet al. 2018; Shao et al. 2019)等。

“landslides”的高频率说明滑坡是极其重要的一类自然灾害。除了已经提到的同震滑坡以外,对于古滑坡和降雨滑坡的研究也是关键内容。Cui etal. (2019)将古滑坡作为断裂活动的证据,Troncone et al. (2021)对降雨滑坡的运动进行预测。强降雨不仅是滑坡的触发因素之一,其本身也属于气象灾害,往往会导致洪水的出现。这也是“flood”频率如此之高的原因之一,因此对与洪水相关的研究也是非常普遍。Tehranyet al. (2015)研究了不同核函数对洪水易发性评估的影响,Grzegorz et al. (2020)的研究提出了一种洪水管理的方法用于灾害防治。“vulnerability”、“model”和“risk”是科学研究中被广泛提及的关键词,尤其是在自然灾害的风险评价和造成损失方面。值得一提的是,“model”的种类是多样的,包括传统的物理模型(Mohammedet al. 2012)、数值模拟模型(Park et al. 2016; Arnone et al. 2021)和风险评价中的机器学习模型(Kalantaret al. 2018)。

然后是在早期研究出版物中出现较多而后续排名下降的关键词,其中“PTSD”是最具有代表性的。与其相关的研究主要是在重大自然灾害之后,对受灾群众的心理影响(Niu etal. 2021)。在2006年之前,PTSD的出现频率位居前二,而在2006年之后,尽管其自身的频率一直在增加,但是其增长速度是低于其他关键词的,因此导致在表格中的排名处于下降趋势。

一些关键词的出现频率,随着时间而不断增加,“climate-change”、“resilience”和“management”是其中的典型代表。“climate-change”代表了在全球变暖和局部地区气候变化频繁的情况下,自然灾害受到一定影响。例如全球变暖导致降雨事件增加,山体滑坡可能会因此更频繁(Garianoet al. 2016),更直接的影响则是洪水发生的概率增加(Kundzewicz et al. 2014),在一些区域,干旱也可能随之加重(Marengoet al. 2017)。“resilience”和“management”则代表了研究者对应急管理、灾害管理和防灾减灾方面的重视,例如社区恢复力、城市韧性等概念的提出(Koliouet al. 2020)。

我们对关键词进行了共现网络分析(图5)。从图中可以看出关键词呈现出明显的聚类。这反映出在自然灾害研究领域内,存在不同的研究方向和领域。例如红色聚类中,以“model”、“landslides”、“gis”和“susceptbility”为代表关键词,与之相关的研究多为地质灾害空间分布与易发性评价。而黄色聚类中的典型关键词则是“climate-change”、“water”、“drought”和“precipitation”等,与之相关的研究多以水旱灾害和气候变化相关。

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w12.jpg

图5 关键词共现网络图
3.7.LDA 模型

在关键词的分析中,我们已经对研究方向和领域进行了简单的概述,但是分类依据主要是根据主观的专业知识水平和典型的关键词。因此我们引入LDA模型,将出版物摘要作为语料库。引入主题一致性作为模型质量的评价标准,通过多次运行,选取最合适的主题数量。当主题数量为14时,模型的主题一致性相对较高。对于在多个主题中都有出现的一些术语,则根据其关联性值大小,尽量将其划分至关联性最大的主题中,当其与多个主题关联性值都较为接近时,则进行保留,每个主题得到10个术语。LDA无法明确得出每个主题的名称,因此根据整体术语的内容,对该主题进行命名(表7)。

Table 7 LDA 模型得到的主题与各主题内代表术语

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w13.jpg

主题之间并非完全独立,而是各有重叠与侧重。将特征词汇的频率总和作为主题的频率,按照时间段进行统计,结果如图6所示。总体频率所反映的发展趋势来看,每一个主题的发展都处于增长状态,而且增长速率也是逐步加快。不过其中一些主题的发展速度(频率增长速度)远超其他。例如“Droughtand water hazards”主题,在2011年之后,相关术语出现频率大幅度增加。“MachineLearning”在2016年之后增长速率加快。而“Mechanismand simulation”和“Risk Assessment”主题则一直是最为高频的主题。

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w14.jpg

图6 主题增长趋势图

4. 讨论

关键词分析和LDA模型分析都在一定程度上反映了自然灾害领域的研究方向。但是两者的来源数据不同,软件是基于关键词,而LDA模型是基于摘要,同时算法也不同。尽管两种方法都得到了较为满意的结果,但是两者综合在一起,会使得结果更为凝练。因此我们在已有基础上,将关键词和术语进行对应,然后统计出主题之间的共现出版物数量作为联系强度。转化数据为软件所需要的格式,从而将LDA模型得到的主题数据利用VOSviewer可视化(图7)。该结果综合了关键词和LDA模型的结果,分类结果更为凝练。

【科技进展】自然灾害领域科技研究的发展现状与趋势分析w15.jpg

图7 主题关系网络图

从图7中可以看出,自然灾害整体研究被划分为7个主要的研究方向或领域,学科交叉和融合明显,且学科之间的联系的强度不同。首先是“Mechanism and simulation”、“Risk assessment”、“Monitoringand early warning”和“Machine learning”被聚为一类。与其认为四个主题互相交叉,不如视为研究的逐步深入。与“Mechanism and simulation”相关联的研究,可分为两方面,一方面是对灾害机制的研究,例如对滑坡失稳与滑动机理的研究(Iqbal et al. 2018)或者对热带气旋的机制研究(Zhao et al. 2014)。而另一方面则是在机制研究的基础上,通过物理模型、软件和平台对灾害过程进行模拟,例如对滑坡进行动态模拟(Liang et al. 2019),或是以洪涝过程作为模拟对象(Ikeuchi et al. 2017)。

风险评价是在灾害机制的基础上,确定灾害的影响因子从而计算得到风险区划。较为常见的风险评价是地质灾害易发性评价研究(Xu et al. 2013)和洪水风险区划(He et al. 2021)。而以上研究则可以有助于实现监测预警,从而避免伤亡和损失。例如滑坡灾害的监测预警通常需要降雨阈值与地表位移监测相结合(Baum et al. 2010; Abraham etal. 2022),而监测的指标获取与仪器安置则需要在建立在灾害机制与风险评价的基础上。机器学习是一项重要的技术理论,机器学习的发展,包括深度学习的兴起,都对自然灾害研究起到了极大的促进作用。在当前自然灾害的研究中,机器学习已经被广泛应用于各个研究方向,例如,Xu et al. (2016)使用支持向量机(SVM)和人工神经网络(ANN)对滑坡进行易发性评价,Wu et al. (2020)对SVM模型进行改进,并将模型用于金沙江白格滑坡的预警中,Ali et al. (2012)利用ANN估算印度洋热带气旋的轨迹。

主题“Marine and MeteorologicalHazards”、“Damages and casualties”和“Psychologicalimpact after hazards”被聚为一类,这一方向的研究主要以灾后的各种损失与影响为主,主要包括人员伤亡、经济损失和受灾群众心理影响。而在这一类研究中,海洋与气象灾害是最为频繁的,例如海啸(Ghobarah et al. 2006)、强降雨(Lee etal. 2020)、热带气旋(Zhang et al. 2009)等。而地震灾害虽然未被归为同一类,但也与这一方向联系紧密,这一点可以通过表7看出。其原因一是地震的破坏力巨大,造成的影响也很严重;其二则是沿海地区的地震通常会引发海啸。“Drought and water hazards”和“EcologicalEnvironment”被聚为一类,这一类的研究是以水旱灾害为主,同时与农业和生态环境关系密切,例如水土流失、全球变暖等因素都会使灾害加剧(Xu et al. 2017b; Thober et al.2018)。“Earthquake”和“GeologicalHazards”的聚类代表着地质灾害与地震的灾害链关系,在相关的研究中,地震是地质灾害的重要触发因子之一(Fan et al. 2019a)。

此外还有三个主题各自成为一个聚类,这并不是因为他们与其他主题关联不明显,真正的原因在于它们与其他主题的密切程度相当,因此无法划分到任一单独的聚类中。以“3S Technology”来说,作为一种技术手段,被广泛应用于自然灾害研究的各个领域。例如利用GIS平台对灾害的空间分布进行分析(Tian et al. 2019),或是进一步对研究区进行风险评价(Das 2018)。而不同种类的卫星可以得到包含不同信息遥感图像,用于不同的用途。在此处我们以不同传感器举例,光学遥感卫星在遥感解译、灾后应急等方面作用显著(Zhao et al. 2019)。雷达遥感卫星提供的数据源则更为丰富,例如地表形变监测(Kang et al. 2021)和洪涝灾情监测(Refice et al. 2014)等。“HazardPrevention and Mitigation”和“Emergency Management”两个主题分别灾前和灾后的应对方法。前者主要为灾前的防治措施,抗灾能力的增强,城市韧性和恢复力的提高。而后者则是灾害发生后的应急工作,包括应急响应、应急救援、应急指挥等内容。

5. 结论

我们采用了文献计量分析和LDA模型的方法,对WOS数据库中25969篇与自然灾害相关的出版物进行了作者、机构、国家/地区、来源期刊、学科和关键词进行了统计分析和主题挖掘,探讨了自然灾害领域的研究方向和研究趋势。

在研究者方面,Pradhan,Biswajeet是发文量和总被引次数最多的作者,Cutter, Susan L.是单篇平均被引次数最多的作者。学术合作方面,与Laplante,David P.合作过的人数是最多的。Chinese Academy Of Sciences是出版物数量最多的机构,但是总被引次数为8941。UniversityOf California System总被引次数最多,University College London单篇平均被引次数最多。合作机构数量最多的机构为UniversityOf California System。美国贡献了最多数量的出版物,同时总被引次数和H因子也是最高,其次是英国。中国发文量仅次于前两者。但是H因子偏低,这说明在更前沿和深入的研究领域,中国有待加强。在学术交流方面,美国、中国和英国是最为重要与活跃的合作伙伴。

期刊方面,最多数量的出版物最多的为Natural Hazards,同时它也是总被引次数最多的期刊。International Journal Of Disaster Risk Reduction的发文量为第二,总被引量为第三。Natural Hazards And Earth System Sciences总被引量为第二。它们是自然灾害领域中具有代表性的期刊,但是近五年的平均影响因子都相对较低,最高为4.933。这说明自然灾害研究在科学领域还需要进一步被重视。在学科方面,Geosciences Multidisciplinary、EnvironmentalSciences和WaterResources具有最多的出版物数量。无论是国家还是机构层面,美国和中国几乎在各个学科都具有突出的贡献。

关键词方面,“earthquake”、“landslide”和“flood”一直是高频率关键词。“climate-change”、“resilience”和“management”频率的不断增加,反映了研究者对气候问题、防灾减灾和应急管理的重视,这代表了新研究热点的出现。LDA模型将自然灾害研究划分出14个主题,其中频率较高的主题有“Mechanismand simulation”、“Risk Assessment”、“Droughtand water hazards”、“Monitoring and early warning”和“Marineand Meteorological Hazards”。主题频率均在增长,而其中增长速率远高于其他主题的有“Droughtand water hazards”和“Machine Learning”。因此我们认为,在未来的研究中,除了一直作为研究重点的地震、滑坡和洪水研究以外,对于气候变化、灾害防治和应急管理的研究可能会成为新的研究热点。机器学习和3S技术的进一步发展将会对自然灾害领域起到极大的促进作用。

综上所述,希望这些研究能够为自然灾害领域的研究者提供一定的参考与帮助。在研究中出现的不足之处在于:一是在数据处理过程中,不排除有不属于自然灾害的文献被检索;二是由于检索式的限制,一些与自然灾害相关的论文未能被检索得到,但不影响本文得出的一般规律。要得到更精确的结果,需要投入更多的时间和精力,我们将会在后续研究中加强这一方面。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|手机版|小黑屋|广告网 ( 鄂ICP备20005464号-17 )

GMT+8, 2024-4-28 05:26

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表