社交媒体数据用于灾害管理的研究综述

【摘要】 近期看到不少论文在探讨社交媒体数据如何用于灾害管理,正想自己整理一篇综述,意外被推送过来一篇纽卡斯尔大学学者发表的调查报告。

【原文摘要】社交媒体在灾害管理中发挥了重要作用,因为它使公众可以通过报告与灾难事件有关的事件来促进灾害的监测。然而,庞大而多样的社交媒体数据,严重制约了其在灾害管理中的可用性,因此,本文提出了社会媒体数据用于灾害管理面临的挑战。我们也提供了对社交媒体数据如何促进灾害管理,以及社交媒体数据管理方法和灾害管理分析方法的调查。该调查包括社交媒体数据分类、事件检测方法以及空间和时间信息抽取。此外,还提出了社交媒体数据管理研究、灾害管理分析等分类方法,并讨论各种方法的核心优势和缺点。

【原文】Phengsuwan, J.; Shah, T.;Thekkummal, N.B.; Wen, Z.; Sun, R.;Pullarkatt, D.; Thirugnanam, H.;Ramesh, M.V .; Morgan, G.; James, P .;Ranjan, R. Use of Social Media Data in Disaster Management: A Survey . Future Internet 2021, 13, 46.

【DOI】 https://doi.org/10.3390/fi13020046

1 概述

1.1 愿景

灾害管理在减轻和减少生命损失以及财产和基础设施损坏方面发挥了重要作用。有效的灾难管理需要基础架构来收集、集成、管理和分析各种分布式数据源,包括地面传感器、视频流和卫星图像[1]。

社交网络和众包的出现使人们能够采用以人为本的方法,使公众能够提供与灾害有关的基本信息。这些信息可用于增强灾害管理在减轻自然灾害影响方面的效力。

社交媒体数据包含有关人类活动、环境条件和公众情绪的丰富信息,地理信息科学家、计算机科学家和领域科学家可以将其用于数据分析[2-4]。社交媒体不仅会生成海量数据,还具备多样性,例如文本、图像和视频。

具体数据支撑:

  • 到2020年,全球社交媒体用户达到35亿,约占世界人口的45%[5]。
  • 截至2020年3月31日
    • Facebook的月活跃用户超过26亿,日活跃用户17.3亿。
    • Twitter在2019年拥有3.3亿月活用户和1.45亿日活跃用户[6]。Twitter用户每日发送5亿条推文,相当于每秒产生5787条推文[7]。
  • 截至2018年6月
    • Instagram上有10亿月活用户,5亿日活用户活。
  • 上述活跃用户生成大量帖子体现了社交媒体数据的多种维度。例如:Twitter数据由几种类型的信息组成,包括帐户ID,时间戳,用户推文(例如,文本,图像,视频),坐标,转推等。
  • 数据的数量、速度和多样性使灾难管理人员越来越难以从此类数据中提取相关的及时信息。

1.2 本文目的

提供一个全面的分类学框架,以有效地探索、评估、对比和比较使用社交媒体数据进行灾难管理的现有方法。以往类似综述文献主要集中在特定方面,相对狭窄且分散。主题包括:

  • 数字志愿服务[8];
  • 灾难管理生命周期[9],包括警告,影响,响应和救济;
  • 灾害响应([10]和[11]),考虑空间、时间、内容和网络范围等方面。

尽管上述论文是根据分类法对文献进行分类的,涵盖了与紧急事件对社交媒体、社交媒体数据收集和处理、社交媒体对灾后管理的影响等方面,但它们的范围有限,仅具有“广泛”的意义。相比之下,我们提出了一个整体而全面的分类框架,并具有附加的(子)维度,有助于对有关端到端挑战的“深入”理解、管理社交媒体数据” 以检测、预测和应对自然灾害。总体而言,这项调查提出了一种新颖的分类法,旨在了解社交媒体数据管理的所有重要方面以及针对灾难管理挑战的分析,从数据源到社交媒体应用。

1.3 总体分类方法

  • 因为本文主要目的是了解社交媒体数据如何对灾难管理做出贡献,所以主要调查了有关社交媒体数据管理和灾难管理分析方法的文献
  • 根据社交媒体数据的来源、语言、信息维度、数据管理/分析/评估方法和应用方法对社交媒体数据进行分类

1.4 本文的主要贡献如下:

  • 查明使用社交媒体数据进行灾害管理以及数据分析方法涉及的研究挑战
  • 提出了一种用于分析和管理社交媒体数据的研究分类法
  • 拟议分类法在调查有关数据分析和管理的现有文献中的应用

2 调研背景

2.1 背景情况

在自然灾害期间,社交媒体可以在应急响应中发挥至关重要的作用,并提供灾难期间和之后的情况的完整图景,但从社交媒体获取和提取与灾害相关的信息存在比较大的挑战。典型挑战包括:数据量、非结构化数据源、信噪比、不合语法、多语言数据、欺诈性消息的识别和清除、数据多样性等。

社交媒体的海量和多样性导致提取出层次水平不一的信息。例如:丘陵道路上一条含有地理标签的推文,比一条普通不含地理标签的推文,提供了更多有关道路堵塞的上下文信息。类似的,附有照片的推文可能会提供多现场情况感知的信息。丘陵道路上一篇附加道路堵塞照片的推文可以帮助正在路上驾驶的人了解路障情况,并调整路线以规避堵塞区域。

2.2 面临技术手段缺乏的挑战

**对于社交媒体数据的海量性、多样性和复杂性,具有可以自动分类和提取信息的工具和系统至关重要。**通过这些工具和系统,将社交媒体数据转换为有意义、可操作信息,以辅助人们掌控态势。

必须根据不同的查询条件可根据要求系统地管理和验证此信息。

  • 查询的主要尺寸包括地理位置/地理围栏,关键词及其消歧,用户类型(例如,政府,非政府组织(非政府组织),新闻机构,公共等)和信息类型(例如,警告,新闻,SOS,供应请求或关于正在进行或即将发生的情况的一般职位/推文)。

  • 除了常见的假阳性模式中,系统也很重要。

    • 例如,推文中的“滑坡”一词谈论体育队的滑坡胜利可能被归类为关于滑坡危险的推文。
    • 为了支持这一点,可以应用诸如本体等工具的使用,从复杂数据中产生有意义的信息。例如,Landslides的本体可以通过相关术语和关系来代表滑坡危害的领域。
    • 这些关系向域术语提供了形式定义,从而使机器能够理解和分析它们。
  • 采用本体论从复杂数据中产生有意义的信息,例如:

    • 滑坡本体将通过相关术语和它们之间的关系来表示滑坡灾害的范围

    • 本体为领域术语提供了正式定义,从而使机器能够理解和分析它们,进而为决策者提供完整图景,并辅助明确的决策

2.3 涉及的支撑技术

(1)本体论

  • 本体方法比传统数据管理方法更为复杂,因为它将数据模型与关联的领域知识相结合,从社交媒体中的自由文本中系统地提取重要信息和语义含义[12]。
  • 虽然有助于使系统足够智能,并以可操作的形式组织和呈现数据,但基于本体论的方法实现难度极高。

(2)信息抽取技术

  • 信息提取技术用于自自由文本中提取重要信息和语义,将有助于使系统足以智能地组织和呈现数据。

(3)自然语言处理

  • 自然语言处理是用于从用户生成的文本内容中提取信息的重要技术手段。文章审查了几种自然语言处理方法和案例[13-15]。

(4)数据挖掘技术

2.4 研究难点

3 调研方法

(略)

4 社交媒体数据的主要数据源

有效的灾害管理需要与灾害有关的高质量丰富数据。数据源可以是提供数据的任何传感器和服务。本节介绍了社交媒体数据分析的四个主要数据源:传感器、社交媒体用户、社交媒体平台和第三方。

4.1 各类传感器

为社交媒体数据分析产生原始数据的传感器,主要包括两类:物理传感器和人类传感器。其中:

  • 物理传感器是一组物理传感装置,其观察和测量物理现象并将观察和测量变为人类可读形式。
    • 遥感器:遥感已被用于远程感知物理和环境条件,并产生覆盖广域的观测数据。
    • 原位传感器:可以直接观察和测量物理现象的兴趣点。原位传感器的示例包括温度传感器,雨量仪和土壤湿度传感器。原位传感适用于需要高精度观察的分析。尽管原位传感方法可以提供高度准确的数据,但原位传感器的部署是难以且非常昂贵的。
    • 传感器网络:无线传感器网络(WSN)[18]是更为高级的传感器系统,包括称为节点的空间分布式传感器。每个节点观察的数据可以在系统内的节点之间交换。WSN在工业过程监控、机器健康监测、自然危害、火灾检测等领域得到大量应用。
  • 社交或人类传感器包括人类活动和相互作用,以观察真实世界事件并在社交网络中产生信息[17]。
    • 社交网络、博客、移动应用程序
      • 社交网络和移动应用程序的出现使人们能够报告观察到的事件。这些活动被视为人类传感[16],可以是有效的城市风险分析的重要数据源。数据来源包括RSS Feeds、Social Media、Instagram、Twitter、Facebook、SMS和在线新闻。
    • 众包数据
      • 众包是一个鼓励人们在特定背景下提供某些任务的贡献的过程。该过程广泛用于灾害管理应用程序,人们可以报告他们观察到的灾难事件。
      • 例如:在2010年,人们使用Ushahidi(一个基于web和移动众包的应用程序),报告海地地震[19]。

4.2 各类社交媒体用户

来自社交媒体上不同账户的消息具有不同的品质和可信度[20]。例如:政府机构使用的官方账户可能比具有个人账户的公共用户更可靠的责任。然而,负责灾害管理的政府机构利用社交媒体传播与灾害有关的信息,但它们在社区中发挥的作用有限。相反,公共用户在灾难事件期间对信息网络贡献发挥了重要作用。 [21]的作者显示了参与各种灾难事件的推特用户的不同分布,公共用户具有明显更大的参与百分比。

总而言之,不同类型社交媒体用户在灾害管理中发挥不同的角色,每个都提供不同的上下文、质量和社交媒体数据的可信度。本文将社交媒体用户的类型分为政府机构、研究/学术机构、非政府组织和公众,如图2所示。

(1)政府机构

​ 政府机构指参与灾难响应和支持的政府组织,他们往往承担以下责任:

  • 向灾难风险地区的人发布官方公告和可采取行动的警告信息

  • 为灾难管理提供支持信息,例如:英国地质调查局和国家气象局等

(2)研究/学术机构

​ 指进行灾难管理研究的机构或研究小组

(3)非政府组织(NGO)

​ 指在社会媒体上传播与灾难有关的信息的私营部门组织,其信息具有以下特点:

  • 提供的信息质量优于普通个人用户
  • 提供的信息比例高于政府机构
  • 例如:“拯救山丘”、有线电视新闻网(CNN)和亚洲新闻国际(ANI)等非政府组织

(4)公众

​ 指拥有个人社交媒体帐户的个人用户,其信息具有以下特点 [22–27]:

  • 提供的信息比例比其他类型用户都高
  • 信息质量和可信度不确定,如何提高数据质量、增强分析准确性一直具有挑战性。

4.3 社交媒体平台

  • 社交媒体平台(例如:Facebook,Twitter,Flicker,Instagram)通常提供访问社交媒体数据的应用编程接口(API) [28]。关于将社交媒体数据用于灾难管理的许多研究都利用此类API直接从社交媒体平台访问社交媒体数据 [22–25]
  • 由于社交媒体数据的非结构化特征和来源的不确定性,收集到的社交媒体数据的质量和可信赖性成为重要问题,需要用于数据准备的附加处理(例如:数据过滤,数据分类和数据提取) [20]
  • 由于隐私问题,某些社交媒体平台(例如Facebook和Twitter)对数据访问设置了限制

4.4 源自第三方的数据集

  • 某些组织和机构处于特定目的收集、组织和开放的社交媒体数据集 [20].

  • 收集的大多数社交媒体数据通常是使用其他过程来准备的,以提供更高质量的数据集

  • 除了用于灾难管理外,还可用作训练数据集并用于数据分析评估 [27]

  • 例如

    • CrisisLexT26提供紧急事件期间与危机相关的推文s [20].

    • CrowdFlower提供了Figure Eight平台,其中包括与各种灾难有关的推文 [29]

5 社交媒体采用的语言

语言是指在社交媒体上发布帖子的语言。调研将社交媒体数据的语言分为四类:通用语言、本地语言、混合语言和混合脚本,如图3所示。

(1)通用语言:指英文社交媒体帖子

(2)本地语言:指英语以外的其他语言社交媒体帖子

(3)混合语言:两种或更多种语言的组合

(4)混合脚本:以两种或多种风格化语言或语言变种发布的社交媒体帖子。 例如,Twitter用户可以采用英语脚本发表Hindi语的推文。

表3说明了社交媒体数据中存在的语言类型。大多数研究采用英语社交媒体,英语也是混合语言中的常用语言。此外,在一些研究中可以看到多种本地语言的社交媒体推文。在理解社交媒体产生的基于文本的信息时,这种变化已经带来了挑战。自然语言处理在从文本信息中提取促进灾害管理信息的过程中发挥了重要作用。

6 社交媒体信息的维度

本节介绍了信息的两个主要维度:空间和时间。这两个维度是灾难管理社交媒体数据的重要组成部分,如下所述。我们还研究了分析社交媒体内容以提取空间和时间信息的各种方法。

6.1 空间维度

尽管地理位置等社交媒体数据的空间表示在基于社交媒体的事件检测或事件分析中扮演着重要角色,但很少有社交媒体数据提供有关用户位置的信息[34]。此外,社交媒体中表示位置的信息多种多样,从使用地理坐标(例如经度和纬度)的非常精确的位置,到使用描述性语言(例如城市名称)的非常模糊的位置。地理信息在社交媒体上以多种方式表示,如图4所示:

image-20210409181822920

(1)地理标签(Geo-tagging):社交媒体系统在用户发布消息时自动或手动(由用户)附加的地理信息。

**(2)用户提及的位置:**用户帖子中提到的地名或地理坐标等位置

(3)空间范围:许多帖子仅提及地理范围,例如:城镇/村庄/地区、国家、大陆或类似信息

在文献中已经提出了几种方法来解决社交媒体中的空间表示问题。在这里,表4展示了用于识别和分析社交媒体数据的空间信息的最先进的方法。

空间维研究情况分析:

(1)地理位置识别方法

  • [34]的研究表明,0.42%的推文使用经纬度功能来标记他们的地理位置,而在100万推特用户中,只有26%列出了城市名称。
  • 在大多数情况下,使用通用表达式(如:California)或无意义的戏谑表达式(如:仙境)。这项研究的目的是检测没有明确提到地理信息的推文位置。为此,作者提出了一种计算单词与城市关联概率的方法。为了提高准确率,作者引入了一个空间变异模型来分析推文中词语的地理分布。
  • [35]的作者提到,推特数据中的地理位置信息可能会有噪声信号。例如:英国用户可以在推特上发布关于休斯顿火箭比赛或他们在印度度假的信息。为了克服这一点,作者整合了来自社交网络的两种信号(用户的朋友和用户推文的附近位置)来预测用户的位置。

(2)地理位置分析

  • 通过分析收集到的推特数据,[36]的作者讨论了2011年8月23日美国东海岸地震的影响。该文的主要发现是距震中距离的空间模式、以及震后时间的关系。
  • [37]的作者使用传感器数据来识别受洪水影响的地区。作者对收集到的数据进行了统计分析,以找出一般的空间模式,并探索相关推文之间的空间模式之间的差异。
  • 核密度估计(KDE)等方法已被广泛应用于飓风桑迪[38]期间的活动聚类和2012年北京暴雨期间的空间热点探测[3]。如:利用传感器数据识别洪水影响区域,分析城市空间格局,人类活动的聚类分析等

6.2 时间维度

大多数社交媒体应用程序都会在发布的数据上附加时间戳。事件之间的时间关系可以从事件的时间戳和内容导出。我们研究了如何在现有的事件检测系统中使用时间信息。在事件检测上下文中,我们将时间信息分为三类,如图5所示。

(1)事件发生前

表示兴趣事件发生之前的时间段,可以对事件发生前发布的社交媒体消息进行分析以得出以下信息:

  • 警告: 例如,来自气象局的暴雨前恶劣天气的帖子、龙卷风警报等,可作为即将发生的自然灾害的警告消息
  • **前兆事件检测:**例如,某个位置有关倾斜电线杆的社交媒体帖子可以用作滑坡事件检测的前兆
  • 时间偏移量: 分析来自社交媒体的事前帖子,以确定该帖子时间与实际事件时间之间的偏移,例如,在该位置的倾斜杆帖子和实际滑坡之后所花费的时间。
  • 来自社交媒体的活动前帖子可以用于服务应急管理的减灾阶段和备灾阶段。

(2)实时

在事件实时发生过程中,社交媒体可被广泛用于关于与事件有关的信息共享。通常,可以对事件发生期间社交媒体的实时帖子进行分析以获得以下信息:

  • 态势感知,例如,“火车取消,喀拉拉邦因大雨而关闭学校”或社交媒体发布的 “由于NH-8滑坡而造成的路障”帖子
  • 得出/发布有关灾难的影响/后果的警告,例如,“预计地震后沿海地区将出现高潮”
  • 响应、救济和恢复,例如,2018年喀拉拉邦洪水期间的一条推文:“梵语学院Palayam的泡沫包装和即食物品短缺”。

(3)事件发生后

在发生灾难之后,社交媒体被广泛用于传达所需的物资、有关失踪人员的信息、死亡人数、财产损失、政府和非政府组织计划的救灾行动、回国时应采取的保护措施、各种当局捐赠的资金等。因此,通常可以对事件后数据进行以下分析:

  • 有关进一步事件的警告
  • 得出有关事件影响的信息
  • 确定所需的救济和恢复措施
  • 确定发布时间与实际事件时间之间的时间偏移

比较重要的是要分析公众/社区在灾害发生前、期间和之后的行为,以便进行有效的灾害应对、管理、规划和减灾。由于社交网络是对民意进行采样的最简单和最常见的方式,我们可以利用社交媒体上带有时间戳和地理标记的数据来实现这一目的。表5总结了时态信息分析的最新方法。

Chae等人[39]解释与飓风桑迪相关的推特数据的时间分析,其中分析了事件日期前后两周的推特用户密度分布,以及事件当天,即疏散命令宣布后的一段时间。Kryvasheyeu等人对同一灾难事件的Twitter数据进行了类似的时空分析研究[40],认为推特在事件发生前(后)活跃水平的持续时间是确定哪些领域最需要援助的良好指标。此外,在灾难期间可以分析推文活跃水平、原创内容创作率和内容转播率以实时识别受灾最严重的地区。新西兰克赖斯特彻奇地震期间的推文数量按照5分钟窗口进行了分析[41]。分析表明,当4.2级或更强的地震在特定时间发生时,它与该时间段内推文数量的激增相关。

在选择社交媒体数据收集的时间框架时,另一个需要考虑的关键因素是灾难类型。对于山体滑坡、洪水和风暴等灾害,我们也许能够在这些事件实际发生之前从社交媒体帖子中捕捉到一些警告信号,而对于其他事件,如:野火和地震,相关的帖子可能只有在这些事件发生后才会浮出水面。

Wang等人[42]通过收集从第一场野火发生到大多数野火被100%控制的日期之间的Twitter数据,分析了美国圣地亚哥县发生的一些重大野火事件中,与野火相关推文的空间、时间、内容和网络。使用不同的关键字(有位置和没有位置)获得的与野火相关的推文的时间演变,让我们深入了解了信息传播所花费的时间延迟。

此外,正如Granell和Ostermann在[43]中提到的,这些事件的影响持续时间也会影响与这些事件相关的数据的时间和上下文变化。例如,实时和事后数据可用于灾难响应和恢复,而事前数据可用于备灾和规划。

文献[3]描述了一个分析2012年北京暴雨期间和之后的社交媒体文本的案例研究,作者对数据进行了时间序列分解,以确定事件的总体趋势和不同发展阶段的变化,以及微博活动的周期性趋势。他们的结论是,不同主题的文本流随时间的趋势分析很好地对应了事件的不同发展阶段。例如,在暴雨过后的一周内,与这一事件相关的文本增加了,随后它们开始慢慢消退,最终淡出。

将这些社交媒体消息分类为不同的上下文类别,并随时间推移对其进行分析,有助于识别灾难管理的不同阶段之间的过渡,并支持有效的备灾、响应和恢复决策。[44]的作者提出了一种基于Logistic回归的分类器,该分类器在不同灾难阶段自动将收集的社交媒体数据分类为不同的主题类别,并在不同阶段对这些主题类别的时间趋势进行分类。使用与飓风桑迪有关的推文进行的实验显示:

  • 关于准备的推文在发布紧急状态声明的前一天达到高峰
  • 与影响有关的推文很大比例是在事件发生后的几天内观察到的
  • 与灾难恢复有关的推文的最大高峰出现在事件发生后五天

7 涉及的主要技术方法

在上一节中,我们讨论了在研究中用于从社交媒体中提取时空信息的最先进的方法和算法。然而,社交媒体数据分析的所有阶段都使用方法和算法。在本节中,我们根据数据分析阶段对应用于社交媒体数据的最流行方法进行分类,如图6所示。表6总结了数据分析阶段的最先进方法。

7.1 数据管理的技术方法

社交媒体的数据管理包括收集、索引、存储和查询社交媒体数据,以了解数据的可访问性、可靠性和及时性。社交媒体每天都会产生大量数据。例如,根据[45],Facebook每天产生大约4PB的数据。庞大的数据量本身给社交媒体数据管理带来了巨大挑战,使其成为大数据问题。因此,社交媒体数据的数据管理和分析系统必须能够处理大数据分析的“四个V”,即数量、种类、速度和准确性。在这一部分中,我们将介绍各种系统中的最新技术,以及涉及用于灾难管理的社交媒体分析的研究。从数据管理的角度,我们回顾了如何收集、筛选、预处理、本地化、存储、索引和查询数据。

Maynard等人[15]提出了一个基于流行的自然语言处理开源框架GATE[46]的实时语义社交媒体分析框架。为了评估该框架,他们使用Twitter流API进行数据收集。对流式处理和批处理方法进行了评估。GATE Cloud Paralleliser(GCP)[47]用于执行文本的批处理(因为支持执行包含数百万个文档的NLP管道),执行加载到GATE管道中的主信息管理系统所需的预处理和转换。它还支持文本、注释和语义的索引。在实时流分析中,Twitter客户端用于从Twitter流API捕获数据,以提供给消息队列。单独的语义分析处理器对文本进行分析和注释,并将其推入Mímir(多范式信息管理索引和存储库),进而使用知识图谱或本体中编码的知识进行语义搜索[48]。这使得索引的文档能够形成语义关系,从而使得在被索引数据集上执行复杂的语义搜索变得容易。GATE Prospector[14]用于探索和搜索Mímir系统中的数据集。

Kim等人提出了社交媒体数据收集和质量评估的概念性框架[49]。该框架的策略包括开发、应用和验证搜索过滤器的三个主要步骤。对检索准确率和检索召回率进行了测量。数据收集的质量评估是分析大量数据(如社交媒体内容)的重要方面,在灾难管理场景中非常重要。搜索过滤器的开发是通过关键字选择来执行的,包括消歧和俚语。该过程通常由领域专家手动执行。搜索过滤器使用标准逻辑运算符(例如:AND、OR和NOT),并通过涉及数据预处理技术(例如:n元语法分析和邻近运算符)来开发。

D-Record[50]利用了三个数据源:Twitter、OpenStreetMap和卫星图像。使用基于支持向量机(SVM)的分类器和合成少数过采样技术(SMOTE)学习的主题建模,扩展了所需概念的一组关键字。

Goonetilleke等人在“Twitter Analytics: A big data management perspective”[13]一书中,回顾了几种用于Twitter数据收集、管理和查询的开源和商业工具,其中许多已经用于灾难管理应用程序。

Wang等人和Wang等人[51,52]开发了一个可扩展的基于网络基础设施的地理信息系统(CyberGIS),用于在自然灾害背景下分析大量社交媒体内容。该系统采用数据融合技术,将社交媒体数据与人口普查数据和遥感图像融合在一起。

Slamet等人提出了一种系统设计[53]来寻找安全位置定位器。它涉及到组合多个数据源,例如位置数据库、政府信息和来自社区的信息,因为它使用关系数据库模型来存储和处理数据。

Yates等人进行了关于应急知识管理和社交媒体技术的案例研究[54]。这项研究调查了社交媒体和相关工具,以实现有效的知识管理。它讨论了美国政府机构如何使用社交媒体数据作为非正式的信息传播机制,并研究了可视化信息分层如何帮助灾难管理场景。

除了文本信息之外,由于社交媒体内容的多样性和复杂性,在极端事件管理[55]中使用诸如图像、音频和视频的多媒体数据仍然具有挑战性。这类事件需要复杂的技术来表示和分析多媒体内容,以便更好地理解极端事件。[56]的作者提出了一种新的基于超图结构的数据模型来管理社交媒体产生的海量多媒体数据。所提出的数据模型包括三个不同的实体(用户、多媒体对象和注释对象)以表示多媒体内容关系的多样性和复杂性。该方法能够将来自不同社交媒体平台的社交媒体内容合并到单个数据结构中。这里提出了影响力扩散算法[57]来调查在特定社交媒体对象上具有重要交互的社交媒体用户。

7.2 数据分析的技术方法

(1)推文分类

在[59]中,研究人员展示了一个使用社会方法的地震事件和早期预警的例子。这是通过整合来自Twitter的语义分析和实时数据来实现的。他们做了两个主要假设:每个推特用户都是一个传感器,每条推文都与时间和地点相关联。通过语义分析将推文分为正类和负类。与地震事件相关的推文被归类为正类,而与地震事件无关的推文被归类为负类。此外,他们使用了一种支持向量机(SVM)对推文分类。

(2)主题分析

潜在狄利克雷分配(LDA)在[60]中被使用,用于从一组社交媒体消息中提取固有的主题结构,并且提取的主题涉及事件(例如,2011年弗吉尼亚州地震)。作者举例说明了主题以及每个主题在所有消息中所占比例,并展示了从这些主题捕获的地震事件如何构成消息的一部分。使用LDA主题模型方法,发现了具有多次迭代的有意义主题。

从所提取的主题中捕获异常事件并不频繁发生,并且通常只覆盖社交媒体数据流的一小部分。为了识别这种异常事件,作者使用了基于局部加权回归的季节性趋势分解方法,并称之为STL。在STL中,reminder组件用于实现控制图,将检测到的异常事件与其他社交媒体数据进行比较以确认异常。

(3)事件检测与态势感知

在[61]中使用了候选检索算法来从数据库中检索事件。作者实现了特征提取来提取空间、时间和文本信息,然后使用评分和排序来确定哪个文档属于哪个事件,支持向量机的分类方法被用于事件检测。

在[63]中提出了一种使用SMART-C的公共卫生监测流程的架构。该架构解释了底层系统提供的数据源及其模式、用户和服务,以便在灾难管理的所有阶段增强态势感知和知情决策。该文讨论了以下需求:事件分类/分组、语义推理、位置确定、事件提取、语音分析、文本分析、视频分析、传感器分析、地理空间分析、响应规划和生成以及警报传播。他们还就安全和隐私、事件检测和关联进行了讨论。

[30]对推特进行了分类和信息提取。作者在Twitter和Weka数据挖掘工具中使用了免费的词性标注软件。出于分类目的,他们首先将推文大致分类为个人推文、信息性推文和其他推文。他们进一步将这些信息丰富的推文分为五类:警告和建议、损害、捐款、人、其他。他们使用朴素贝叶斯分类器进行特征提取,并使用单字、双字和词性标签在分类器中提供丰富的特征集。一旦一条推文被分类,序列标记任务就会使用条件随机场识别相关信息。

(4)空间信息挖掘

文献[64]讨论了一种基于参与式感知的城市突发事件空间信息挖掘模型。研究人员对台风灿鸿事件进行了模拟,他们提出了一个具有三个不同层次的分层数据模型:社会用户层、众包层、空间信息层。在社会用户层,该方法收集与突发事件相关的数据。在众包层,收集了正样本,并挖掘了地址和地理信息系统数据,与相同紧急事件相关的信息聚集在这一层中。在空间信息层,对突发事件的空间信息进行挖掘。对地理标记微博数据的语义分析有助于从空间角度获得民意,并可在需要的地方提供帮助。从收集的数据来看,北京、浙江、江苏和上海的风险很高。

(5)用户位置估计

在[34]中,作者提出了一个根据推特用户的推文内容识别推特用户位置的概率框架。作者使用简单的CART分类器对地理范围较强的推文进行分类,然后使用基于网格的邻域平滑模型来细化用户位置。他们还表明,随着推文数量的增加,位置估计的过程会收敛。

文献[35]的作者提出了一个统一的差别影响模型来解决用户在推特上定位的问题。他们采用概率方法进行局部预测和全局预测来分析用户位置。基于局部预测的分析使用用户的朋友、追随者和他们的tweet来高效地分析用户的位置,而全局预测则使用未标记的用户来准确地分析用户的位置。

(6)文本语义分析

在D-Record[50]中,文本句子被矢量化以捕捉它们的语义。在特征提取之前,文本经过词干提取、案例折叠和去除噪声词汇元素的预处理,使用基于词典特征的SVM分类器、TF-IDF向量和word2vec嵌入。

8 主要应用

在本节中,我们将在灾害管理策略的背景下调查社交媒体应用程序的贡献。灾害管理策略是一门在可能的情况下应对或避免灾害的学科。一般而言,灾害管理战略由四个阶段组成:减灾、备灾、应对和恢复[65]。这四个阶段需要支持工具和技术来进行有效的灾害管理。最近的几项研究工作利用社交媒体数据来解决不同类型灾害和灾害管理阶段的问题。

根据紧急事件数据库(EM-DAT)[66],一般有两类灾害:自然灾害和技术灾害,每一类中都有几种类型的灾害。图7描述了本文研究的灾难管理中社交媒体应用的两个重要维度:灾难管理阶段和灾难管理类型。灾难管理阶段代表由社交媒体应用程序贡献的灾难管理生命周期阶段,而灾难管理类型代表灾难应用程序组。基于这些维度,我们调查了用于灾难管理的现有社交媒体应用程序的当前覆盖范围以及现有应用程序的总体情况。

8.1 灾难管理的阶段

灾害管理阶段描述了灾害的正常生命周期,并为应对提供了一个有用的框架[65]。正如我们已经确定的那样,在灾害管理的不同阶段,社交媒体的使用有所增加。在文献中已经提出了几种将社交媒体应用于灾害管理的技术。如6.1和6.2节所述,社交媒体数据通常是用空间和时间信息生成的。这些信息可用于促进不同阶段的灾害管理。

  • 减灾阶段–将灾害的起因和影响降至最低并防止其发展为灾难的行动。

  • 备灾阶段–社区应对无法预防的危险事件的行动计划和教育活动。

  • 响应阶段–在发生灾害或灾害事件时保护人民生命财产安全的行动。

  • 恢复阶段–修复受损财产和社区基础设施以及治愈人们疾病的行动。

8.2 灾难管理类型

灾害管理类型是指根据灾害的根本原因进行分类的灾害组。根据国际灾害数据库(EMDAT)[66],主要有两类灾害:自然灾害和技术灾害。

  • 自然灾害–指在自然过程或自然现象中发生的,可能造成人民生命财产损失的自然事件。
    • 自然灾害又分为生物灾害、地球物理灾害、气候灾害、水文灾害、气象灾害和地外灾害六大类。
    • 自然灾害的一些例子包括洪水、山体滑坡、地震和海啸。
  • 技术灾害–指技术过程或人类活动造成的灾难。技术灾难的一些例子是工业和运输事故。

表7列出了社交媒体数据在灾害管理中的应用。我们确定了每个文献提出的社交媒体应用的灾难管理阶段和灾难类型的子类。因此,这揭示了目前社交媒体在灾害管理中应用的现状。

[16]的作者提出了一种新方法,将社交媒体数据视为人类传感器,并使用社交媒体观察技术灾难(石油目击)和自然灾害(地震和空气质量)。提取了地理位置,并将其用作预测漏油的边界。[39]和[40]的作者分析了推特上的数据,以确定在自然灾害(飓风桑迪)期间从空间和时间角度的公众行为模式。[3]对紧急事件期间使用社交媒体的紧急信息分发进行了调查。这项工作使用分类和定位模型对2012年北京暴雨期间的社交媒体流进行了分析。[44]的作者使用基于逻辑回归的分类器分析了关于飓风桑迪的推文,以找出时间趋势。表7中提到的社交媒体应用程序是为了解决灾害管理不同阶段的问题而提出的。[16,39,40,44]中的工作解决了备灾阶段的问题,而[3,16,39,40,44]中的结果用于响应阶段。[39,40]中概述的应用程序用于恢复阶段。

可以看出,大多数研究都侧重于将社交媒体数据应用于自然灾害,而不是技术灾难。然而大多数工作中提出的方法可以应用于灾害管理的多个阶段。有趣的是,响应阶段是利用社交媒体数据最受欢迎的方面,而目前还没有适用于减灾阶段的可用文献。

9 结论

在这篇文章中,我们回顾了研究性的文献,以调查社交媒体数据的贡献,以及数据管理和分析技术在灾害管理中的作用。基于提出的分类方法,我们研究了贡献的各个维度,包括数据源、语言、时空信息、方法和应用程序。

以人为中心的方法(如社交媒体、博客和众包)已成为重要的数据源,可提供真实世界事件的观测数据并有助于灾害管理。一些文献提出利用社交媒体数据进行灾害管理,Twitter是用于灾害管理的最重要的社交媒体数据来源之一。

从Twitter上提取的时间和空间信息是支持灾害管理决策的关键信息,地理位置识别和分析是灾害管理中空间视角的关键研究挑战。尽管文献中已经提出了几种方法,但这些挑战仍然没有得到解决。然而,社交媒体内容以及时间信息(包括发布时间和事件时间)可以通过几种方式用于促进灾难管理。许多研究工作使用这些信息来检测前兆事件或支持灾害期间的决策。

此外,文献中还提出了几种管理、分析和评估社交媒体数据的方法。显然,由于社交媒体数据的海量生成,大数据技术是社交媒体数据管理的关键技术。此外,机器学习和信息检索算法被广泛用于从社交媒体收集、分类和提取重要信息。这些信息包括时间和空间信息以及灾害事件。F值、精确度和召回率是评估数据收集、分类和提取方法的常用技术。最后,这项调查的应用前景表明,社交媒体在灾害管理的各个阶段都发挥着重要作用,生成的数据在灾害管理中得到了广泛的应用。

参考文献

  1. Adeel, A.; Gogate, M.; Farooq, S.; Ieracitano, C.; Dashtipour, K.; Larijani, H.; Hussain, A. A Survey on the Role of Wireless Sensor Networks and IoT in Disaster Management. In Geological Disaster Monitoring Based on Sensor Networks; Durrani, T.S., Wang, W.,Forbes, S.M., Eds.; Springer Singapore: Singapore, 2019; pp. 57–66, doi:10.1007/978-981-13-0992-2_5.

  2. Li, L.; Goodchild, M.F.; Xu, B. Spatial, temporal, and socioeconomic patterns in the use of Twitter and Flickr. Cartogr. Geogr. Inf.
    Sci. 2013, 40, 61–77.

  3. Wang, Y .; Wang, T.; Ye, X.; Zhu, J.; Lee, J. Using social media for emergency response and urban sustainability: A case study of
    the 2012 Beijing rainstorm. Sustainability 2015, 8, 25.

  4. Zhao, P .; Qin, K.; Ye, X.; Wang, Y .; Chen, Y . A trajectory clustering approach based on decision graph and data field for detecting
    hotspots. Int. J. Geogr. Inf. Sci. 2017, 31, 1101–1127.

  5. Maryam Mohsin, M.Y .S. 10 Social Media Statistics You Need to Know in 2020 [Infographic]. Available online: https://www.
    oberlo.com/blog/social-media-marketing-statistics (accessed on 10 June 2020).

  6. Zephoria. The Top 20 Valuable Facebook Statistics—Updated May 2020. Available online: https://zephoria.com/top-15
    -valuable-facebook-statistics/ (accessed on 10 June 2020).

  7. Twitter. Quarterly Results. Available online: https://investor.twitterinc.com/financial-information/quarterly-results/default.
    aspx (accessed on 10 June 2020).

  8. Abdulhamid, N.G.; Ayoung, D.A.; Kashefi, A.; Sigweni, B. A survey of social media use in emergency situations: A literature
    review. Inf. Dev. 2020, 0266666920913894, doi:10.1177/0266666920913894.

  9. Nazer, T.H.; Xue, G.; Ji, Y .; Liu, H. Intelligent Disaster Response via Social Media Analysis A Survey . SIGKDD Explor. Newsl. 2017,
    19, 46–59, doi:10.1145/3137597.3137602.

  10. Wang, Z.; Ye, X. Social media analytics for natural disaster management. Int. J. Geogr. Inf. Sci. 2018, 32, 49–72,
    doi:10.1080/13658816.2017.1367003.

  11. Saroj, A.; Pal, S. Use of social media in crisis management: A survey . Int. J. Disaster Risk Reduct. 2020, 48, 101584,
    doi:10.1016/j.ijdrr.2020.101584.

  12. Munir, K.; Anjum, M.S. The use of ontologies for effective knowledge modelling and information retrieval. Appl. Comput.
    Informatics 2018, 14, 116–126, doi:10.1016/j.aci.2017.07.003.

  13. Goonetilleke, O.; Sellis, T.; Zhang, X.; Sathe, S. Twitter analytics: a big data management perspective. ACM Sigkdd Explor. Newsl.
    2014, 16, 11–20.

  14. Tablan, V .; Bontcheva, K.; Roberts, I.; Cunningham, H. Mímir: An open-source semantic search framework for interactive
    information seeking and discovery . Web Semant. Sci. Serv. Agents World Wide Web 2015, 30, 52–68.

  15. Maynard, D.; Roberts, I.; Greenwood, M.A.; Rout, D.; Bontcheva, K. A framework for real-time semantic social media analysis.
    Web Semant. Sci. Serv. Agents World Wide Web 2017, 44, 75–88.

  16. Aulov , O.; Halem, M. Human Sensor Networks for Improved Modeling of Natural Disasters. Proc. IEEE 2012, 100, 2812–2823,
    doi:10.1109/JPROC.2012.2195629.

  17. Wang, D.; Amin, M.T.; Li, S.; Abdelzaher, T.; Kaplan, L.; Gu, S.; Pan, C.; Liu, H.; Aggarwal, C.C.; Ganti, R.; Wang, X.; Mohapatra, P .;
    Szymanski, B.; Le, H. Using humans as sensors: An estimation-theoretic perspective. In Proceedings of the IPSN-14 Proceedings
    of the 13th International Symposium on Information Processing in Sensor Networks, Berlin, Germany , 15–17 April 2014; pp.
    35–46, doi:10.1109/IPSN.2014.6846739.

  18. Yick, J.; Mukherjee, B.; Ghosal, D. Wireless sensor network survey . Comput. Networks 2008, 52, 2292–2330,
    doi:10.1016/j.comnet.2008.04.002.

  19. Shen, H. Discussion and Analysis of the Crowdsourcing Mode of Public Participation in Emergency Management. In Proceedings
    of the 2015 8th International Symposium on Computational Intelligence and Design (ISCID), Hangzhou, China, 12–13 December
    2015; pp. 610–613, doi:10.1109/ISCID.2015.115.

  20. Immonen, A.; Pääkkönen, P .; Ovaska, E. Evaluating the Quality of Social Media Data in Big Data Architecture. IEEE Access 2015,
    3, 2028–2043, doi:10.1109/ACCESS.2015.2490723.

  21. Steinberg, A.; Wukich, C.; Wu, H. Central Social Media Actors in Disaster Information Networks. Int. J. Mass Emergencies Disasters
    2016, 34, 47–74.

  22. Yin, J.; Lampert, A.; Cameron, M.; Robinson, B.; Power, R. Using Social Media to Enhance Emergency Situation Awareness.
    IEEE Intell. Syst. 2012, 27, 52–59. doi:10.1109/MIS.2012.6.

  23. Rogstadius, J.; Vukovic, M.; Teixeira, C.A.; Kostakos, V .; Karapanos, E.; Laredo, J.A. CrisisTracker: Crowdsourced social media
    curation for disaster awareness. IBM J. Res. Dev. 2013, 57, 4:1–4:13, doi:10.1147/JRD.2013.2260692.

  24. Middleton, S.E.; Middleton, L.; Modafferi, S. Real-Time Crisis Mapping of Natural Disasters Using Social Media. IEEE Intell. Syst.
    2014, 29, 9–17, doi:10.1109/MIS.2013.126.

  25. Kuriakose, S.L.; Sankar, G.; Muraleedharan, C. History of landslide susceptibility and a chorology of landslide-prone areas in the
    Western Ghats of Kerala, India. Environ. Geol. 2009, 57, 1553–1568, doi:10.1007/s00254-008-1431-9.

  26. Olteanu, A.; Castillo, C.; Diaz, F.; Vieweg, S. CrisisLex: A Lexicon for Collecting and Filtering Microblogged Communications in
    Crises. In Proceedings of the Eighth International Conference on Weblogs and Social Media (ICWSM), Ann Arbor, MJ, USA, 1–4
    June 2014.

  27. To, H.; Agrawal, S.; Kim, S.H.; Shahabi, C. On Identifying Disaster-Related Tweets: Matching-based or Learning-based? In
    Proceedings of the 2017 IEEE third international conference on multimedia big data (BigMM), Laguna Hills, CA, USA, 19–21
    April 2017; pp. 330–337.

  28. Lomborg, S.; Bechmann, A. Using APIs for Data Collection on Social Media. Inf. Soc. 2014, 30, 256–265,
    doi:10.1080/01972243.2014.915276.

  29. Eight, F. Data For Everyone. Available online: https://www.figure-eight.com/data-for-everyone/ (accessed on 22 January 2019).

  30. Imran, M.; Elbassuoni, S.; Castillo, C.; Diaz, F.; Meier, P . Practical extraction of disaster-relevant information from social media. In
    Proceedings of the 22nd International Conference on World Wide Web, Rio de Janeiro, Brazil, 13–17 May 2013; pp. 1021–1024.

  31. Takahashi, B.; Tandoc, E.C.; Carmichael, C. Communicating on Twitter during a disaster: An analysis of tweets during Typhoon
    Haiyan in the Philippines. Comput. Hum. Behav. 2015, 50, 392–398, doi:10.1016/j.chb.2015.04.020.

  32. Rudra, K.; Ganguly , N.; Goyal, P .; Ghosh, S. Extracting and Summarizing Situational Information from the Twitter Social Media
    during Disasters. ACM T rans. Web 2018, 12, doi:10.1145/3178541.

  33. Zamarreño-Aramendia, G.; Cristòfol, F.J.; De-San-eugenio vela, J.; Ginesta, X. Social-media analysis for disaster prevention: Forest
    fire in artenara and valleseco, Canary Islands. J. Open Innov. T echnol. Mark. Complex. 2020, 6, 1–18, doi:10.3390/joitmc6040169.

  34. Cheng, Z.; Caverlee, J.; Lee, K. You are where you tweet: a content-based approach to geo-locating twitter users. In Proceedings
    of the 19th ACM International Conference on Information and Knowledge Management, Toronto, ON, Canada, 26–30 October
    2010; pp. 759–768.

  35. Li, R.; Wang, S.; Deng, H.; Wang, R.; Chang, K.C.C. Towards social user profiling: unified and discriminative influence model for
    inferring home locations. In Proceedings of the 18th ACM SIGKDD International conference on Knowledge Discovery and Data
    Mining, Beijing, China, 12–16 August 2012 ; pp. 1023–1031.

  36. Crooks, A.; Croitoru, A.; Stefanidis, A.; Radzikowski, J. # Earthquake: Twitter as a distributed sensor system. T rans. GIS 2013,
    17, 124–147.

  37. De Albuquerque, J.P .; Herfort, B.; Brenning, A.; Zipf, A. A geographic approach for combining social media and authoritative
    data towards identifying useful information for disaster management. Int. J. Geogr. Inf. Sci. 2015, 29, 667–689.

  38. Guan, X.; Chen, C. Using social media data to understand and assess disasters. Nat. Hazards 2014, 74, 837–850.

  39. Chae, J.; Thom, D.; Jang, Y .; Kim, S.; Ertl, T.; Ebert, D.S. Public behavior response analysis in disaster events utilizing visual
    analytics of microblog data. Comput. Graph. 2014, 38, 51–60.

  40. Kryvasheyeu, Y .; Chen, H.; Obradovich, N.; Moro, E.; Van Hentenryck, P .; Fowler, J.; Cebrian, M. Rapid assessment of disaster
    damage using social media activity . Sci. Adv. 2016, 2, e1500779.

  41. Yin, J.; Karimi, S.; Lampert, A.; Cameron, M.; Robinson, B.; Power, R. Using social media to enhance emergency situation
    awareness. In Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence, Buenos Aires, Argentina,
    25–31 July 2015.

  42. Wang, Z.; Ye, X.; Tsou, M.H. Spatial, temporal, and content analysis of Twitter for wildfire hazards. Nat. Hazards 2016, 83, 523–540.

  43. Granell, C.; Ostermann, F.O. Beyond data collection: Objectives and methods of research using VGI and geo-social media for
    disaster management. Comput. Environ. Urban Syst. 2016, 59, 231–243.

  44. Huang, Q.; Xiao, Y . Geographic situational awareness: mining tweets for disaster preparedness, emergency response, impact,
    and recovery . ISPRS Int. J. Geo. Inf. 2015, 4, 1549–1568.

  45. kinsta. Wild and Interesting Facebook Statistics and Facts. 2020. Available online: https://kinsta.com/blog/facebook-statistics/
    (accessed on 10 June 2020).

  46. Cunningham, H.; Tablan, V .; Roberts, A.; Bontcheva, K. Getting more out of biomedical documents with GATE’s full lifecycle
    open source text analytics. PLoS Comput. Biol. 2013, 9, e1002854.

  47. GATE. The GATE Cloud Paralleliser (GCP). Available online: https://gate.ac.uk/gcp/ (accessed on 10 September 2020).

  48. Cunningham, H.; Tablan, V .; Roberts, I.; Greenwood, M.A.; Aswani, N. Information Extraction and Semantic Annotation for
    Multi-Paradigm Information Management. In Current Challenges in Patent Information Retrieval; Lupu, M., Mayer, K., Tait, J.,
    Trippe, A.J., Eds.; Springer: Berlin/Heidelberg, Germany , 2011; pp. 307–327, doi:10.1007/978-3-642-19231-9_15.

  49. Kim, Y .; Huang, J.; Emery , S. Garbage in, garbage out: data collection, quality assessment and reporting standards for social
    media data use in health research, infodemiology and digital disease detection. J. Med Internet Res. 2016, 18, e41.

  50. Kar, S.; Al-Olimat, H.S.; Thirunarayan, K.; Shalin, V .; Sheth, A.; Parthasarathy , S. D-record: Disaster Response and Relief
    Coordination Pipeline. In Proceedings of the ACM SIGSPATIAL International Workshop on Advances in Resilient and Intelligent
    Cities (ARIC) 2018, Seattle, WA, USA, 6–9 November 2018.

  51. Wang, S.; Anselin, L.; Bhaduri, B.; Crosby , C.; Goodchild, M.F.; Liu, Y .; Nyerges, T.L. CyberGIS software: a synthetic review and
    integration roadmap. Int. J. Geogr. Inf. Sci. 2013, 27, 2122–2145.

  52. Wang, S. A CyberGIS framework for the synthesis of cyberinfrastructure, GIS, and spatial analysis. Ann. Assoc. Am. Geogr. 2010,
    100, 535–557.

  53. Slamet, C.; Rahman, A.; Sutedi, A.; Darmalaksana, W.; Ramdhani, M.A.; Maylawati, D.S. Social Media-Based Identifier for
    Natural Disaster. In Proceedings of the IOP Conference Series: Materials Science and Engineering 2018, Kuala Lumpur, Malaysia,
    13–14 August 2018.

  54. Yates, D.; Paquette, S. Emergency knowledge management and social media technologies: A case study of the 2010 Haitian
    earthquake. Int. J. Inf. Manag. 2010, 31, 6–13…

  55. Amato, F.; Moscato, V .; Picariello, A.; Sperli’ì, G. Extreme events management using multimedia social networks. Future Gener.
    Comput. Syst. 2019, 94, 444–452, doi:10.1016/j.future.2018.11.035.

  56. Amato, F.; Moscato, V .; Picariello, A.; Sperlí, G. Multimedia Social Network Modeling: A Proposal. In Proceedings of the 2016
    IEEE Tenth International Conference on Semantic Computing (ICSC), Laguna Hills, CA, USA, 4–6 Feburary 2016; pp. 448–453.

  57. Amato, F.; Moscato, V .; Picariello, A.; Sperlí, G. Diffusion Algorithms in Multimedia Social Networks: A Preliminary Model. In
    Proceedings of the 2017 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining, Sydney ,
    Australia, 31 July–3 August 2017; pp. 844–851.

  58. Derczynski, L.; Maynard, D.; Rizzo, G.; van Erp, M.; Gorrell, G.; Troncy , R.; Petrak, J.; Bontcheva, K. Analysis of named entity
    recognition and linking for tweets. Inf. Process. Manag. 2015, 51, 32 – 49, doi:10.1016/j.ipm.2014.10.006.

  59. Sakaki, T.; Okazaki, M.; Matsuo, Y . Tweet analysis for real-time event detection and earthquake reporting system development.
    IEEE T rans. Knowl. Data Eng. 2013, 25, 919–931.

  60. Chae, J.; Thom, D.; Bosch, H.; Jang, Y .; Maciejewski, R.; Ebert, D.S.; Ertl, T. Spatiotemporal social media analytics for abnormal
    event detection and examination using seasonal-trend decomposition. In Proceedings of the Visual Analytics Science and
    Technology (V AST), 2012, Seattle, WA, USA, 14–19 October 2012; pp. 143–152.

  61. Reuter, T.; Cimiano, P . Event-based classification of social media streams. In Proceedings of the 2nd ACM International
    Conference on Multimedia Retrieval, Hong Kong, China, 1 June 2012; p. 22.

  62. Becker, H.; Naaman, M.; Gravano, L. Learning similarity metrics for event identification in social media. In Proceedings of the
    Third ACM International Conference on Web Search and Data Mining, New York City , NY , USA, 3–6 Feburary 2010; pp. 291–300.

  63. Adam, N.R.; Shafiq, B.; Staffin, R. Spatial computing and social media in the context of disaster management. IEEE Intell. Syst.
    2012, 27, 90–96.

  64. Xu, Z.; Zhang, H.; Sugumaran, V .; Choo, K.K.R.; Mei, L.; Zhu, Y . Participatory sensing-based semantic and spatial analysis of
    urban emergency events using mobile social media. EURASIP J. Wirel. Commun. Netw. 2016, 2016, 44.

  65. Albtoush, R.; Dobrescu, R.; Ionescou, F. A hierarchical model for emergency management systems. Univ. Politeh. Buchar. Sci. Bull.
    Ser. Electr. Eng. 2011, 73, 53–62.

  66. EM-DAT. EM-DAT the International Disaster Database. Available online: https://www.emdat.be/classification (accessed on 8
    May 2020).