从自然语言文本中收割地理空间大数据
p{text-indent:2em}
从自然语言文本中收割地理空间大数据
【评论】在非结构化自然语言本文中获取地理相关信息是一个很有意思而又有难度的话题,也是知识层次体系结构中,“数据–>信息–>知识 ”最完整的过程体现。Yingjie Hu 等在德国慕尼黑技术大学知名教授Martin WerNER的新书《Handbook of Big Geospatial Data》中,专门撰写了名为《Harvesting big geospatial data from natural language texts》的一章,来阐述相关的技术进展状态。
【原文摘要】大量地理空间数据存在于自然语言文本中,例如报纸、维基百科文章、社交媒体帖子、旅游博客、在线评论和历史档案。与美国地质调查局和国家统计局收集的更传统、更结构化的地理空间数据相比,从这些非结构化文本中获得的地理空间数据具有独特的优势。它们捕捉人类对不同地点的感受,反映不同地理区域的近实时态势,或记录其他方式无法获得的重要历史信息。此外,这些非结构化文本中的地理空间数据在数量、速度和多样性方面通常都很大。本文介绍了从自然 ...
GeoAI:社交媒体数据用于灾害管理的研究综述
p{text-indent:2em}
社交媒体数据用于灾害管理的研究综述
【摘要】 近期看到不少论文在探讨社交媒体数据如何用于灾害管理,正想自己整理一篇综述,意外被推送过来一篇纽卡斯尔大学学者发表的调查报告。
【原文摘要】社交媒体在灾害管理中发挥了重要作用,因为它使公众可以通过报告与灾难事件有关的事件来促进灾害的监测。然而,庞大而多样的社交媒体数据,严重制约了其在灾害管理中的可用性,因此,本文提出了社会媒体数据用于灾害管理面临的挑战。我们也提供了对社交媒体数据如何促进灾害管理,以及社交媒体数据管理方法和灾害管理分析方法的调查。该调查包括社交媒体数据分类、事件检测方法以及空间和时间信息抽取。此外,还提出了社交媒体数据管理研究、灾害管理分析等分类方法,并讨论各种方法的核心优势和缺点。
【原文】Phengsuwan, J.; Shah, T.;Thekkummal, N.B.; Wen, Z.; Sun, R.;Pullarkatt, D.; Thirugnanam, H.;Ramesh, M.V .; Morgan, G.; James, P .;Ranjan, R. Use ...
非结构化文本的地理定位
非结构化文本的地理定位
【摘要】根据前文介绍,地理信息抽取是构建地理知识图谱的核心,而对非结构文本的地理定位是地理信息抽取技术的核心。本文对非结构文本的地理定位研究现状进行了梳理。鉴于国内地理信息科学和计算机信息科学为两个学科,而地理定位属于跨学科、研究难度偏大的命题,国内比较深度或成体系的研究较少,因此本文主要针对国际相关研究情况。
【原文】
【DOI】
1. 文本中的地理引用
地理引用(Geoeferences)
文本中对位置的指称(形式上为文本片段)被称为地理引用,也称位置引用、位置标识、地理标签。
**地理引用的案例:**地理引用的形式多样,例如,以下形式都可以定位北京大学:
北京市海淀区颐和园路5号 – 北京大学的通信地址
北京大学 – 北京大学的地名
100871 – 北京大学的中国邮政编码
X8P4+Q8 – 北京大学的谷歌开放位置码
39.986913,116.3036799 – 北京大学的经纬度
此外,还有很多在专业领域编制的具有空间位置含义的编码,如:北京大学的不动产单元登记码、北京大学的城市管理网格码等,均 ...
地理知识图谱「 2 」-- 地理信息抽取技术
地理信息抽取–未来地理信息科学中的皇冠
摘要:
根据前文,地理知识图谱主要分为两个大的研究领域或流派,其中地理知识图谱以领域地理知识库建设为重点,其中利用地理信息抽取技术完善、丰化知识库内容是较为核心的技术点。本文是对地理信息抽取技术的概览,希望有助于对该技术方向的了解和把握。
1. 位置搜索对地理信息抽取的现实性需求
互联网领域中大部分信息搜索查询中明确包含地理搜索词
例如:以地名的形式(Gan等人,2008年;Aloteibi和Sanderson,2014年)
80%的互联网用户会利用位置搜索引擎获取本地商业服务、产品或其他领域知识
在移动应用蓬勃发展的当下,基于位置的知识服务成为核心功能
以用户当前或预测位置为基础提供实时地理知识图谱上下文信息(Reichenbacher等人,2016)。
2. 地理信息抽取的必要性
信息和知识服务的现状
搜索引擎领域:尽管在位置搜索上投入了大量资金,但大部分检索结果局限于商业目录中的信息
知识服务领域:大量领域知识有待于数字化、信息化,并最终转换为知识内容提供服务
机遇:
随着Web2.0/3 ...