非结构化文本的地理定位
非结构化文本的地理定位【摘要】根据前文介绍,地理信息抽取是构建地理知识图谱的核心,而对非结构文本的地理定位是地理信息抽取技术的核心。本文对非结构文本的地理定位研究现状进行了梳理。鉴于国内地理信息科学和计算机信息科学为两个学科,而地理定位属于跨学科、研究难度偏大的命题,国内比较深度或成体系的研究较少,因此本文主要针对国际相关研究情况。 【原文】 【DOI】 1. 文本中的地理引用 地理引用(Geoeferences) 文本中对位置的指称(形式上为文本片段)被称为地理引用,也称位置引用、位置标识、地理标签。 地理引用的案例:地理引用的形式多样,例如,以下形式都可以定位北京大学: 北京市海淀区颐和园路5号 – 北京大学的通信地址 北京大学 – 北京大学的地名 100871 – 北京大学的中国邮政编码 X8P4+Q8 – 北京大学的谷歌开放位置码 39.986913,116.3036799 –...
地理知识图谱「 2 」-- 地理信息抽取技术
地理信息抽取–未来地理信息科学中的皇冠摘要: 根据前文,地理知识图谱主要分为两个大的研究领域或流派,其中地理知识图谱以领域地理知识库建设为重点,其中利用地理信息抽取技术完善、丰化知识库内容是较为核心的技术点。本文是对地理信息抽取技术的概览,希望有助于对该技术方向的了解和把握。 1. 位置搜索对地理信息抽取的现实性需求 互联网领域中大部分信息搜索查询中明确包含地理搜索词 例如:以地名的形式(Gan等人,2008年;Aloteibi和Sanderson,2014年) 80%的互联网用户会利用位置搜索引擎获取本地商业服务、产品或其他领域知识 在移动应用蓬勃发展的当下,基于位置的知识服务成为核心功能 以用户当前或预测位置为基础提供实时地理知识图谱上下文信息(Reichenbacher等人,2016)。 2....
地理空间语义的六个主要研究领域
地理空间语义的六个主要研究领域【摘要】 【原文】 【DOI】 一、地理空间语义的概念1.1 基本概念“understanding GIS contents, and capturing this understanding in formal theories.” 1.2 核心任务:理解地理信息系统的内容(1)地理空间语义谁来理解地理空间语义?(2)机器还是人?如果是人的话,地理空间语义的重点是人类对地理概念和空间关系的认知;(3)如果是机器的话,则重点在分布式系统之间的语义互操作。 1.3 实现方式:采用形式化理论来捕获对地理信息系统内容的理解(1)采用本体作为形式化声明来描述概念和关系(2)用一阶逻辑/描述逻辑等形式化逻辑来定义本体内的概念和公理 1.4 地理空间语义的两个发展方向趋势1:传统地理空间数据以结构化链接数据的形式组织、发布、抽取和重用 地理空间语义网 趋势2:半结构化、非结构化数据的地理语义抽取、时空模式分析 地理信息抽取、地理知识图谱、GeoAI 1.5 六个地理空间语义的研究领域 语义互操作性与本体 数字地名词典 2....