一种地理加权人工神经网络 -- GWANN
一种地理加权人工神经网络
【摘 要】 虽然最近的发展在许多方向上扩展了地理加权回归( GWR ),但通常假设因变量和自变量之间的关系是线性的。然而,在实践中,变量往往是非线性关联的。为解决该问题,荷兰乌特勒支大学 Hagenauer 等提出了一种地理加权人工神经网络( GWANNGWANNGWANN )。 GWANNGWANNGWANN 将地理加权与人工神经网络相结合,能够在无假设情况下以数据驱动方式学习复杂的非线性关系。通过已知空间特征的合成数据和真实世界案例研究,作者将 GWANNGWANNGWANN 和 GWR 进行了比较。合成数据的结果表明,当数据之间关系是非线性且空间方差较大时, GWANNGWANNGWANN 算法的性能要好于 GWR 算法,而基于真实数据的结果表明, GWANNGWANNGWANN 算法在实际应用中也可以取得更好的性能。
【原 文】 Hagenauer, J. and M. Helbich ( 2021 ). “A geographically weighted artificial neural network.” International ...
空间统计学概论
空间统计学概论
1 统计学的两大流派
(1)频率学派
认为模型的待估计参数是一个未知的常数,而样本是随机的,通过对随机样本的分析,可以计算获得参数的值。
基本思想(对事件建模)
「随机事件本身具有某种客观的随机性」,需要研究一系列工具来刻画「事件」本身
事件A在独立重复试验中发生的频率趋于极限 ppp ,那么极限 ppp 就是该事件的概率
参数估计时
主要是对模型做假设,但不对参数的分布做假设
求参数符合样本的最优化解,通过正则化解决过拟合问题
如:极大似然估计、最小交叉熵、最小二乘估计…
预测时
预测的结果:参数支持下确定的结果
结果不确定性的量化:通过方差来量化不确定性
核心体现为最优化问题
需要通过最优化算法求得参数的数值解
代表性模型
SVM等各种统计机器学习方法、前馈神经网络…
(2)贝叶斯学派
认为模型的待估计参数是一个随机变量,而样本是固定的,通过对样本的学习不断更新经验,能够使对参数的分布认识更准确。
基本思想(对人的知识建模)
「随机事件」是因「观察者」知识状态中尚未包含该事件的结果而导致,需要通过观察 ...
空间表征学习之Tile2Vec
p{text-indent:2em}
空间表征学习之Tile2Vec
【摘要】
【原文】
【DOI】
空间表征学习之Space2Vec
空间表征学习之Space2Vec
【摘要】无监督文本编码模型最近推动了自然语言处理的实质性进展。其关键思想是使用神经网络将文本中的词转换为基于单词位置及其上下文的向量空间表示( 词嵌入 ),进而用于下游任务的端到端训练。我们在空间分析中看到了惊人的相似情况,即空间分析侧重于将地理对象( 如:POI点 )的绝对位置和空间上下文纳入模型。一个通用的空间表征模型对于许多任务都是有价值的。然而,迄今为止,除了简单地将离散化或前馈网络应用于坐标之外,还没有这样通用的模型存在,并且很少有努力对具有非常不同特征的分布进行联合建模,而这些特征经常出现在地理信系统数据中。神经科学领域诺贝尔奖得主的研究表明,哺乳动物的网格细胞(Grid Cell)提供了一种多尺度、周期性的位置编码表示,对于动物识别位置和寻找路径至关重要。因此,我们提出了一个称为 Space2Vec 的空间表征学习模型来编码地点(Place)的绝对位置和空间关系。我们对两个不同任务在两个真实世界的地理数据上进行实验:1)在给定位置和上下文的情况下预测 POI 点的类型;2)利用POI点的地理位置进行图像分类。结果表明,由于Sp ...
空间表征学习之Place2Vec
p{text-indent:2em}
空间表征学习之Place2Vec
【摘要】理解、表示和推理POI点的类型是地理信息检索、推荐系统、地理知识图谱以及研究一般城市空间的重要方面(例如:从用户生成内容中提取功能性或模糊性认知区域的任务)。这些任务的先决条件之一是能够捕捉POI点类型之间的相似性或相关性。直觉上,当人们搜索汽车维修点时,即使没有精确的匹配结果,返回汽车美容店甚至加油站仍然可能满足一些用户需求,但返回天文馆则不会。也就是说,POI点类型的层次结构常用于扩展或者联想查询。但大多数现有POI点类型的层次结构较浅,并且往往结构是人为设计确定的,造成在某些特征方面可能密切相关的POI点类型被分开了,进而影响了扩展或联想查询的效果。这就引出了如何从数据中学习POI点类型表示的问题。近年,自然语言处理领域的词嵌入(如Word2Vec)对于词相似性表征发挥了重要作用,为POI点类型的表征提供了思路。但地理空间结构(如POI点类型间的相互作用)与语言学有很大不同,不能直接套用。本文提出了一种新方法来增强POI点类型的空间上下文,使用距离分割和信息论方法来生成嵌入。我们证明,该工 ...
地理知识发现中的空间显式人工智能技术
GeoAI:地理知识发现中的空间显式人工智能技术
【摘要】 近年随着深度学习技术的突飞猛进,相关技术在地理信息科学领域也得到大量研究和应用。但随着大家对问题的深入理解,逐步意识到这些机器学习方法在解决地学问题上有些捉襟见肘,特别是很多机器学习模型几乎不考虑地理位置的作用,把很多地学问题转变成了计算机科学问题,引起了业内很多专家的质疑。本文为加州大学 Krzysztof Janowicz 教授 2017 年在地理信息科学杂志 GeoAI 专刊上发表的一篇评论文章,明确提出在地理空间人工智能领域中,空间显示模型需要得到重视和发展。
【原文摘要】无。
【原文】Janowicz, K., et al. (2019). “GeoAI: spatially explicit artificial intelligence techniques for geographic knowledge discovery and beyond.” International Journal of Geographical Information Science 34(4): 625-636.
【 ...
GeoAI 的近期研究总结与思考
【摘 要】本文摘自武汉大学学报,作者在文章中列举了大量GeoAI领域的文献参考,值得收藏。尤其是梳理和总结了当前5个主要研究热点方向,并列出了最近急迫需要解决的3个方面挑战。
【原 文】高松,地理空间人工智能的近期研究总结与思考,武汉大学学报,DOI:10.13203/j.whugis20200597
1 GeoAI 的发展历史简介
(1)GeoAI背景
人工智能(AI)领域的技术进步给地理空间相关领域研究的智能化发展和融合创新带来了新机遇和新挑战。
近期快速发展的主要动力来自于深度学习模型和开发框架的快速发展、产业化的日趋成熟、各行业领域大数据的爆发、计算机硬件计算性能不断升级,进而可以支持在很短的时间内训练和部署人工智能模型、支持数据驱动的智能化决策和产业变革
(2)什么是GeoAI?
地理空间人工智能(GeoAI)是地理空间科学与人工智能相结合的交叉学科研究方向
GeoAI通过研究与开发机器的空间智能,提升对于地理现象和地球科学过程的动态感知、智能推理和知识发现能力
GeoAI寻求解决人类和地球环境系统相互作用中的重大科学和工程问题
比如:人口迁移预测、复杂条 ...
【面元数据】之数据模型篇
【阅读建议】 空间数据集通常被分为三种类型:面元数据、面元数据和点模式数据,本文重点介绍面元数据的形式化定义。
【引文信息】
p{text-indent:2em}
按照惯例,通常将空间数据集分为三种基本类型:
面元数据 (Point-referenced data)
其中 $$Y(s)$$ 是位置 $$\mathbf{s} \in \mathit{R}^r$$ 处的随机向量,其中 $$\mathbf{s}$$ 在 $$\mathit{R}^r$$ 的一个固定子集 $$D$$ 上 连续变化,具有 $$r$$ 维矩形的正体积;
面元数据(Areal data)
其中 $$D$$ 依然是 $$\mathit{R}^r$$ 的一个固定子集,具有规则或不规则的形状,不过现在 $$D$$ 被 划分 为有限数量的、具有明确边界的面元;
点模式数据(Point pattern data)
D$$ 本身是随机的;其索引的集合 (Index set) 给出了作为空间点模式的随机事件的位置。 $$Y(s)$$ 本身对于所有 $$s \in D$$ 可以简单地等于 $$1$$ (表示事 ...
【点模式数据】之数据模型篇
【阅读建议】 空间数据集通常被分为三种类型:点模式数据、点模式数据和点模式数据,本文重点介绍点模式数据的形式化定义。
【引文信息】
p{text-indent:2em}
按照惯例,通常将空间数据集分为三种基本类型:
点模式数据 (Point-referenced data)
其中 Y(s)Y(s)Y(s) 是位置 s∈Rr\mathbf{s} \in \mathit{R}^rs∈Rr 处的随机向量,其中 s\mathbf{s}s 在 Rr\mathit{R}^rRr 的一个固定子集 DDD 上 连续变化,具有 rrr 维矩形的正体积;
点模式数据(Areal data)
其中 DDD 依然是 Rr\mathit{R}^rRr 的一个固定子集,具有规则或不规则的形状,不过现在 DDD 被 划分 为有限数量的、具有明确边界的点模式;
点模式数据(Point pattern data)
DDD 本身是随机的;其索引的集合 (Index set) 给出了作为空间点模式的随机事件的位置。 Y(s)Y(s)Y(s) 本身对于所有 s∈Ds \in Ds∈D 可以简单地等于 ...
非零范围空间对象的索引方法--XZ序曲线索引
XZ-Ordering Method
1 背景
空间数据库系统的索引结构,主体采用R树索引及其各种变体。这些方法采用树状结构,树中每个节点均对应物理存储中的一页(Page)。该方法的问题在于,当在传统关系型数据库中实现R树时,无法直接和属性数据组合在一起统一管理,必须额外地增加一个索引文件或者索引表单独实现地理空间对象的空间索引,这种方式也被称为混合索引方案。这种混合索引方案存在以下几个方面问题:
非常难以维护,因为要保持两种结构的同步更新。如果一方更新失败,都会导致另一方被迫停止。为实现这一目的,必须要实现一种面向同质数据库系统的分布式提交协议,这需要对数据库内部技术细节非常了解,实现起来也非常耗时。采取混合索引方案会带来其他问题,例如:文件系统和数据库系统采用的是完全不同的数据安全策略、备份策略和并发访问策略,维护起来非常复杂。
面向对象数据库系统(另外一种NoSQL数据库)可能是解决上述问题的一种方案,因为面向对象数据库可以扩展面向应用的数据类型。但是在对象数据库中,如果要实现多维索引结构,也需要使用数据管理系统在块层级的存储管理访问接口,而大部分数据库管理系统并不 ...