空间统计学概论
空间统计学概论1 统计学的两大流派(1)频率学派认为模型的待估计参数是一个未知的常数,而样本是随机的,通过对随机样本的分析,可以计算获得参数的值。 基本思想(对事件建模) 「随机事件本身具有某种客观的随机性」,需要研究一系列工具来刻画「事件」本身 事件A在独立重复试验中发生的频率趋于极限 $p$ ,那么极限 $p$...
空间表征学习之Tile2Vec
p{text-indent:2em} 空间表征学习之Tile2Vec【摘要】 【原文】 【DOI】
空间表征学习之Space2Vec
空间表征学习之Space2Vec【摘要】无监督文本编码模型最近推动了自然语言处理的实质性进展。其关键思想是使用神经网络将文本中的词转换为基于单词位置及其上下文的向量空间表示( 词嵌入 ),进而用于下游任务的端到端训练。我们在空间分析中看到了惊人的相似情况,即空间分析侧重于将地理对象( 如:POI点 )的绝对位置和空间上下文纳入模型。一个通用的空间表征模型对于许多任务都是有价值的。然而,迄今为止,除了简单地将离散化或前馈网络应用于坐标之外,还没有这样通用的模型存在,并且很少有努力对具有非常不同特征的分布进行联合建模,而这些特征经常出现在地理信系统数据中。神经科学领域诺贝尔奖得主的研究表明,哺乳动物的网格细胞(Grid Cell)提供了一种多尺度、周期性的位置编码表示,对于动物识别位置和寻找路径至关重要。因此,我们提出了一个称为 Space2Vec 的空间表征学习模型来编码地点(Place)的绝对位置和空间关系。我们对两个不同任务在两个真实世界的地理数据上进行实验:1)在给定位置和上下文的情况下预测 POI...
地理知识发现中的空间显式人工智能技术
GeoAI:地理知识发现中的空间显式人工智能技术【摘要】 近年随着深度学习技术的突飞猛进,相关技术在地理信息科学领域也得到大量研究和应用。但随着大家对问题的深入理解,逐步意识到这些机器学习方法在解决地学问题上有些捉襟见肘,特别是很多机器学习模型几乎不考虑地理位置的作用,把很多地学问题转变成了计算机科学问题,引起了业内很多专家的质疑。本文为加州大学 Krzysztof Janowicz 教授 2017 年在地理信息科学杂志 GeoAI 专刊上发表的一篇评论文章,明确提出在地理空间人工智能领域中,空间显示模型需要得到重视和发展。 【原文摘要】无。 【原文】Janowicz, K., et al. (2019). “GeoAI: spatially explicit artificial intelligence techniques for geographic knowledge discovery and beyond.” International Journal of Geographical Information Science 34(4):...
GeoAI 的近期研究总结与思考
【摘 要】本文摘自武汉大学学报,作者在文章中列举了大量GeoAI领域的文献参考,值得收藏。尤其是梳理和总结了当前5个主要研究热点方向,并列出了最近急迫需要解决的3个方面挑战。 【原 文】高松,地理空间人工智能的近期研究总结与思考,武汉大学学报,DOI:10.13203/j.whugis20200597 1 GeoAI...
【面元数据】之数据模型篇
【阅读建议】 空间数据集通常被分为三种类型:面元数据、面元数据和点模式数据,本文重点介绍面元数据的形式化定义。 【引文信息】 p{text-indent:2em} 按照惯例,通常将空间数据集分为三种基本类型: 面元数据 (Point-referenced data) 其中 $$Y(s)$$ 是位置 $$\mathbf{s} \in \mathit{R}^r$$ 处的随机向量,其中 $$\mathbf{s}$$ 在 $$\mathit{R}^r$$ 的一个固定子集 $$D$$ 上 连续变化,具有 $$r$$ 维矩形的正体积; 面元数据(Areal data) 其中 $$D$$ 依然是 $$\mathit{R}^r$$ 的一个固定子集,具有规则或不规则的形状,不过现在 $$D$$ 被 划分 为有限数量的、具有明确边界的面元; 点模式数据(Point pattern data) $$D$$ 本身是随机的;其索引的集合 (Index set) 给出了作为空间点模式的随机事件的位置。 $$Y(s)$$ 本身对于所有 $$s \in D$$ 可以简单地等于 $$1$$...
【点模式数据】之数据模型篇
【阅读建议】 空间数据集通常被分为三种类型:点模式数据、点模式数据和点模式数据,本文重点介绍点模式数据的形式化定义。 【引文信息】 p{text-indent:2em} 按照惯例,通常将空间数据集分为三种基本类型: 点模式数据 (Point-referenced data) 其中 $Y(s)$ 是位置 $\mathbf{s} \in \mathit{R}^r$ 处的随机向量,其中 $\mathbf{s}$ 在 $\mathit{R}^r$ 的一个固定子集 $D$ 上 连续变化,具有 $r$ 维矩形的正体积; 点模式数据(Areal data) 其中 $D$ 依然是 $\mathit{R}^r$ 的一个固定子集,具有规则或不规则的形状,不过现在 $D$ 被 划分 为有限数量的、具有明确边界的点模式; 点模式数据(Point pattern data) $D$ 本身是随机的;其索引的集合 (Index set) 给出了作为空间点模式的随机事件的位置。 $Y(s)$ 本身对于所有 $s \in D$ 可以简单地等于 $1$...
非零范围空间对象的索引方法--XZ序曲线索引
XZ-Ordering Method 1 背景 ...
分布式空间数据库「 6 」-- 空间填充曲线的聚簇性分析
空间填充曲线的聚簇性分析一、 概述先说结论,作者将曲线分为连续型(Hillbert、Peano等)、近连续型、非连续型(Z序、Morton等)分开讨论。 1.1 关于矩形查询的通用结论(1)对于固定尺寸的“矩形查询 $r$ ”,存在一个平均簇值的最优解(下限)。 (2)上述最优解(下限)受限于 $r$ 的体积(用r中的单元数做量化)和形状(用 $r$中各维度上的边数来量化)。 (3)通常连续性曲线较非连续型曲线更接近最优解(下限)。 (4)对于固定尺寸的“矩形查询 $r$ “ ,仅考虑部分旋转集时,总是构造一种连续型曲线,使其平均簇值达到最优值(下限)。 (5)对于固定尺寸的“矩形查询 $r$”,考虑其全旋转集时,所有连续型曲线的平均簇值都是最优解。 1.2 关于连续型曲线的结论(1)对于连续型填充曲线,通过将某个查询 $g$ 在各维度上做所有可能的平移后,得出统计结论: 该情况下,查询 $g$ 的平均簇值仅和 $g$ 的体积(用 $g$ 内的单元数做量化)、形状(用 $g$...