利用合成地图为历史地图文本检测生成无限训练数据
【摘 要】 许多历史地图页可公开用于需要长期历史地理数据的研究。这些地图的制图设计包括地图符号和文字标签的组合。从地图图像中自动读取文本标签可以大大加快地图解释速度,并有助于生成描述地图内容的丰富元数据。已经提出了许多文本检测算法来自动定位地图图像中的文本区域,但大多数算法都是在域外数据集(例如风景图像)上训练的。训练数据决定了机器学习模型的质量,而在地图图像中手动标注文本区域既费力又费时。另一方面,现有的地理数据源,例如 OpenStreetMap (OSM),包含机器可读的地图图层,这使我们可以轻松地分离出文本图层并获得文本标签注释。但是,OSM 地图瓦片和历史地图之间的制图风格明显不同。本文提出了一种自动生成无限量带注释的历史地图图像的方法,用于训练文本检测模型。我们使用样式转换模型将当代地图图像转换为历史样式并在其上放置文本标签。我们表明,最先进的文本检测模型(例如 PSENet)可以从合成历史地图中受益,并在历史地图文本检测方面取得显着改进。
【原 文】Zekun Li, Runyu Guan, Qianmu Yu, Yao-Yi Chiang, and Crai ...
2021 年GeoAI 研讨会总结
【摘 要】 许多历史地图页可公开用于需要长期历史地理数据的研究。这些地图的制图设计包括地图符号和文字标签的组合。从地图图像中自动读取文本标签可以大大加快地图解释速度,并有助于生成描述地图内容的丰富元数据。已经提出了许多文本检测算法来自动定位地图图像中的文本区域,但大多数算法都是在域外数据集(例如风景图像)上训练的。训练数据决定了机器学习模型的质量,而在地图图像中手动标注文本区域既费力又费时。另一方面,现有的地理数据源,例如 OpenStreetMap (OSM),包含机器可读的地图图层,这使我们可以轻松地分离出文本图层并获得文本标签注释。但是,OSM 地图瓦片和历史地图之间的制图风格明显不同。本文提出了一种自动生成无限量带注释的历史地图图像的方法,用于训练文本检测模型。我们使用样式转换模型将当代地图图像转换为历史样式并在其上放置文本标签。我们表明,最先进的文本检测模型(例如 PSENet)可以从合成历史地图中受益,并在历史地图文本检测方面取得显着改进。
【原 文】 Lunga, D., Hu, Y., Newsam, S., Gao, S., Martins, B., Ya ...
空间变系数模型的新旧方法
【摘要】 本文比较了空间异质性建模中空间变化参数模型的一些主要方法,其中包括:(1)21 世纪前提出的传统方法,包括:空间展开模型、空间自适应滤波模型和地理加权回归模型。(2)21 世纪初以来出现的一些新方法,包括:空间平滑过渡自回归模型、空间高斯过程模型、含自回归过程的随机参数模型。(3)一些通用变参数模型方法在空间异质性建模中的应用,包括:空间样条方法等。文中采用人工合成数据,以图形方式展示了不同方法之间的差异。注意:不知为何原因,本文未提及空间滤波方法。
【原文】 D. M. Lambert, “Old and new approaches for spatially varying coefficient models,” Review of Regional Studies, vol. 51, no. 2, pp. 113–128, 2021, doi: 10.52324/001c.27969.
《空间回归模型综述》 一文对面元数据的空间回归模型进行了综述,总体分为全局空间回归模型和局部空间回归模型,文中也谈到全局空间回归模型重点讨论邻近的目标变量、因变量、以及 ...
空间局部化思维对于统计和社会的重要性
【摘 要】 在过去的二十年里,越来越多的注意力集中在局部形式的空间分析上,无论是在描述性统计还是空间建模方面,我们称之为 “局部化思维”。局部化思维的基础在于:全局空间分析方法可能不适用,并且待测量的条件关系存在随空间变化的情况。本文不仅研究了局部化思维对空间过程建模的影响,而且更广泛地考察了人们对空间行为的理解。我们首先简要调查了局部统计建模的原因;然后描述一种局部建模框架(多尺度地理加权回归),以展示局部模型中的基本概念和此类模型的输出类型;之后,我们研究了局部方法对统计分析的影响,重点是局部模型与空间回归模型相比的作用、局部模型的诊断、局部方法如何与困扰空间分析数十年的空间尺度问题相关联等问题;最后,我们将注意力转向空间局部建模方法对社会的影响,讨论了可复制性以及如何使用空间局部模型来测量以前无法测量的基于地点的效应。文中通过一个房价影响因素的实例来证明在整篇论文中提出的问题。
【原 文】 A. S. Fotheringham and M. Sachdeva, Spatial Statistics, vol. 50, p. 100601, 2022, doi: 10 ...
空间回归模型综述
空间回归模型概述
【摘要】 空间回归模型是按照空间区位研究变量之间关系的主要数学工具。根据回归模型是否存在空间同质特征(或反之空间异质性),通常可以将空间回归模型划分为 全局空间回归模型 和 局部空间回归模型。
【原文】 自编
【作者】 濮国梁,北京大学
1 概述
p{text-indent:2em}
空间回归模型是按照空间区位研究变量之间关系的主要数学工具之一。根据空间回归模型是否同质(或反之是否异质,可以简单理解为模型参数是否会随空间位置变化而变化 ),可以将空间回归模型划分为 全局空间回归模型 和 局部空间回归模型。其中:
全局空间回归模型以空间依赖性研究为主体,主要探究的是不同变量、误差项之间的空间交互效应;
局部回归模型则相对复杂,它不仅要研究变量、误差项之间的空间交互效应,还要研究模型本身( 通常指 模型结构 和 模型参数 )的空间变化规律,探究的重点是 空间异质性。
flowchart LR
A[空间回归模型]---B{变系数检验}
B---|否|C01[全局空间回归]
B---|是|C02[局部空间回归]
C01---D ...
数据驱动地球系统科学的深度学习和过程理解
【摘 要】机器学习方法越来越多地用于从不断增长的地理空间数据流中提取模式和见解,但是当系统行为受空间或时间上下文支配时,当前的方法可能不是最优的。在这里,我们认为应该将这些上下文线索用作深度学习( 一种能够自动提取时空特征的方法 )的一部分,而不是仅仅对经典机器学习方法做修补,以获得对地球系统科学问题更进一步的过程理解。例如,改善季节性预报的预测能力、跨多个时间尺度的远距离空间连接性建模。下一个阶段将会是将 物理过程模型 与 数据驱动的机器学习多功能性 相结合的混合建模方法时代。
【原 文】 M. Reichstein, G. Camps-Valls, B. Stevens, M. Jung, J. Denzler, and N. Carvalhais, “Deep learning and process understanding for data-driven earth system science,” Nature, vol. 566, no. 7743, pp. 195–204, 2019.
【阅后感】2019年,德国马克斯普朗克研究所、美国劳伦斯伯克利实验室等 ...
空间回归模型综述
摘 要
参 考
1 概述
空间回归模型是按照空间区位研究变量之间关系的主要数学工具之一。根据空间回归模型是否同质(或反之是否异质,可以简单理解为模型参数是否会随空间位置变化而变化 ),可以将空间回归模型划分为 全局空间回归模型 和 局部空间回归模型。其中:
全局空间回归模型以 空间依赖性 研究为主体,主要探究的是不同变量、误差项之间存在的空间交互效应;
局部回归模型则相对复杂,它不仅要研究变量、误差项之间的空间交互效应,还要研究模型本身( 通常指 模型结构 和 模型参数 )的空间变化规律,探究的重点是 空间异质性。
flowchart LR
A[空间回归模型]---B{变系数检验}
B---|否|C01[全局空间回归]
B---|是|C02[局部空间回归]
C01---D01[空间滞后模型]
C01---D02[空间误差模型]
C01---D03[空间杜宾模型]
C01---D05[其他模型...]
D01---F01[模型参数不随空间位置变化]
D01---F01
D02---F01
D03---F01 ...
🔥 空间表征学习综述文章
【摘要】无监督文本编码模型最近推动了自然语言处理的实质性进展。其关键思想是使用神经网络将文本中的词转换为基于单词位置及其上下文的向量空间表示( 词嵌入 ),进而用于下游任务的端到端训练。我们在空间分析中看到了惊人的相似情况,即空间分析侧重于将地理对象( 如:POI点 )的绝对位置和空间上下文纳入模型。一个通用的空间表征模型对于许多任务都是有价值的。然而,迄今为止,除了简单地将离散化或前馈网络应用于坐标之外,还没有这样通用的模型存在,并且很少有努力对具有非常不同特征的分布进行联合建模,而这些特征经常出现在地理信系统数据中。神经科学领域诺贝尔奖得主的研究表明,哺乳动物的网格细胞(Grid Cell)提供了一种多尺度、周期性的位置编码表示,对于动物识别位置和寻找路径至关重要。因此,我们提出了一个称为 Space2Vec 的空间表征学习模型来编码地点(Place)的绝对位置和空间关系。我们对两个不同任务在两个真实世界的地理数据上进行实验:1)在给定位置和上下文的情况下预测 POI 点的类型;2)利用POI点的地理位置进行图像分类。结果表明,由于Space2Vec具有多尺度表示能力, ...
GeoAI 中的位置编码:方法和应用
【阅读建议】 本文是空间位置嵌入的第一篇比较全面的综述,涉及新概念、新方法和未来可能的新应用,比较有想象空间。但阅读后感觉将必要性简单地表述为机器学习的需要,似乎并不充分(第 2 节);另外该概念到底带来了那些提升、对未来哪些冲击、影响和改变,似乎可以更进一步提炼,目前尚难以感觉到值得深入研究的价值。
【原文摘要】 地球科学对人工智能模型的共同需求,是在潜在的嵌入空间中表示点、线、多边形、网络、栅格等多种类型的空间数据,以便能够很容易地将这些数据融入到深度学习模型中去。一个基本做法是通过编码过程将位置转换到嵌入空间中,而这种嵌入表示对于下游机器学习模型(例如支持向量机和神经网络)来说是学习友好的,我们将此过程称为位置编码。目前,对于位置编码的概念、潜在应用以及需要解决的关键挑战,尚缺乏系统的回顾,而本文旨在填补这一空白。本文首先提供了位置编码的形式化定义,并从机器学习角度讨论了位置编码对于 GeoAI 研究的必要性,然后对位置编码研究的现状进行了较为全面地调查和讨论。依据输入和编码方法,我们将位置编码模型分为了不同类别,并根据其是否参数模型、多尺度性、距离保持和方向感知等性 ...
点参考数据及克里金法
【阅读建议】 点参考数据的空间预测和模拟问题,大致有传统克里金法和目前应用比较广泛的基于似然的方法。本文主要介绍源于地统计学的传统克里金方法,一来掌握空间统计中的基础方法,二来便于与后面几篇文章中提到的高斯过程之间建立联系。克里金方法在对空间随机场作出本征平稳假设的情况下,利用参数化的变异函数对不同位置处随机变量的偏差之间存在的空间结构(相关性)进行建模,利用有限样本点的最大似然求解最优参数,并将其用于预测任务。
【引文信息】
[1] 史舟, 李艳编, 地统计学在土壤学中的应用. Beijing: Zhong guo nong ye chu ban she, 2006.
[2] 王政权, 地统计学及在生态学中的应用. Bei jing: Ke xue chu ban she, 1999.
1 引言
空间数据的获取通常具有一定的成本,是进行空间分析的基础与起源。为了提高研究结论的精度,我们希望能够获取研究区域内更多、更全面的精确空间属性数据信息。然而,在实际研究工作中,由于人力成本、资源等外部条件限制,我们无法对全部未知区域加以采样与测量,而往往只能得到研究区域内有限数量 ...