西山晴雪的知识笔记

发表于2022-11-20|GeoAI空间变系数模型点参考数据

【摘要】许多应用的目标是建立一套回归模型，以便在空间相关性假设下对感兴趣区域上的响应变量作出解释。在几乎所有这些工作中，回归系数都假定为在该区域内恒定。但在某些应用中，预测系数会在局部或子区域水平上有所不同，而这种情形正是本文的重点。尽管空间表面（ Surface ）的参数化建模是可能的（如多项式表面建模、样条建模等），但我们认为将其视为空间随机过程的一次实现更为自然和灵活。在本文中，我们展示了在高斯响应背景下，如何对这种建模方法进行形式化，使其能够在随机效应和残差分析方面提供更有吸引力的解释。我们还提供了广义线性模型和时空场景的扩展。文中将在单户住宅售价数据集上展示静态和动态建模和解释能力。【参考】 Gelfand, A. E., Kim, H.-J., Sirmans, C. F., & Banerjee, S. (2003). Spatial modeling with spatially varying coefficient processes. Journal of the American Statistical Association, 98 ...

空间随机场及其建模方法

发表于2022-11-18|GeoAI点参考数据空间数据建模

【摘要】空间数据集通常被分为三种类型：点参考数据、面元数据和点模式数据，本文重点介绍点参考数据的建模基础–空间随机场，讨论了空间随机场的一些基本假设和性质，及其形式化定义。【原文】 O. Schabenberger and C. A. Gotway, Chapter 2，Statistical methods for spatial data analysis. Boca Raton: Chapman & Hall/CRC, 2005. 1 随机过程与随机场（1）随机过程与随机场随机过程是随机变量族或集合，其成员可以根据某种度量来识别或索引。例如：时间序列 Y(t)，t=t1,…,tnY (t)，t = t_1,\ldots,t_nY(t)，t=t1,…,tn 由观测该序列的时间点 t1,…,tnt_1,\ldots,t_nt1,…,tn 索引。空间过程也是随机变量的集合，只是其中的随机变量由包含空间坐标 s=[s1,s2,⋅⋅⋅,sd]′\mathbf{s} =[s_1,s_2, ···,s_d]^\primes=[s1,s2,⋅⋅⋅ ...

多尺度地理加权回归

发表于2022-11-15|GeoAI空间变系数模型

其中 nnn 表示样本大小，σ^\hat{\sigma}σ^ 定义为误差项的标准差，tr⁡(S)\operatorname{tr}(\boldsymbol{S})tr(S) 是帽子矩阵的迹。选定带宽后，可以进一步计算权重，并在每个校准位置拟合 GWR 模型，以获得一组局部系数。通过取每个校准位置的局部 R2R^{2}R2 的平均值，可以获得 GWR 模型的总体 R2R^{2}R2 值。【原文】 Fotheringham, A. Stewart and Yang, Wenbai and Kang, Wei. Multiscale Geographically Weighted Regression (MGWR) 2017. Annals of the American Association of Geographers , Vol. 107, No. 6 p. 1247-1265. 【阅后感】本文作者是地理加权回归方法的提出者之一，也是《地理加权回归：空间可变关系的分析》一书的作者。在提出地理加权回归十余年后，作者发现原来的方法对于尺度缺乏建模能力（即解释变量可能来 ...

贝叶斯分层模型

发表于2022-11-13|GeoAI空间贝叶斯方法空间建模思维

【摘要】本文简要介绍了贝叶斯分层建模方法的概念、优势和局限性。【原文】 N. Cressie, chapter 2, Statistics for spatio-temporal data. 2011. 核心内容快速浏览（1）贝叶斯全概率公式贝叶斯全概率公式允许将随机变量的联合分布分解为一系列条件分布： [A,B,C]=[A∣B,C][B∣C][C][A, B, C] = [A | B, C][B | C][C] [A,B,C]=[A∣B,C][B∣C][C] 其中 “[⋅][ \cdot ][⋅]” 用于表示概率分布；例如，[A,B,C][A, B, C][A,B,C] 是随机变量 AAA、BBB 和 CCC 的联合分布，而 [A∣B,C][A | B, C][A∣B,C] 是给定 BBB 和 CCC 时 AAA 的条件分布。（2）Berlinear 的贝叶斯分层模型 (BHM) 范式 Mark Berliner （Berliner，1996）是最早使用贝叶斯全概率公式分解来为复杂过程建模的人。也就是说，联合分布 [data,process,parameter ...

空间过程的贝叶斯建模分析方法综述

发表于2022-11-11|GeoAI点参考数据空间数据建模

【阅读建议】本文重点介绍点参考空间数据的贝叶斯建模和分析方法，尤其是贝叶斯分层建模框架。点参考数据（也被称为地统计数据）主要指在固定空间位置观测到的随机变量数据。过去二十年中，此类数据在空间和时间上的收集量已经大大增加，随之而来的是分析此类数据的大量方法。本文尝试对其中的贝叶斯方法进行回顾。此类分析方法的好处是能够进行全面而准确的推断，并对不确定性进行适当评估。地统计建模的测站数据虽然比较复杂，涉及单变量和多变量、连续型和类别型、静态和动态以及大量长时间观测结果等，但在贝叶斯分层模型框架内，可以统一进行描述和阐释。本文另一亮点在于对大规模观测数据的建模问题做了综述，介绍了降秩方法（高斯预测过程模型）和近邻方法（近邻高斯过程模型）两类主要的处理策略。【引文信息】 A. E. Gelfand and S. Banerjee, “Bayesian Modeling and Analysis of Geostatistical Data,” Annu Rev Stat Appl, vol. 4, pp. 245–266, 2017, doi: 10.1146/annurev-s ...

地理加权回归模型

发表于2022-11-10|GeoAI空间变系数模型

〖摘要〗空间异质性是地理学第二定律的核心。从地理信息科学角度，空间异质性主要包含两种类型，一是随空间变化，空间某些变量之间的关系发生了明显变化；二是随空间变化，空间某些变量的统计量（如：均值、方差）会出现平稳或者不平稳的变化。地理加权回归是空间计量学、地理空间统计学中为研究第一种空间异质性（即变量间关系的空间异质性）而提出的工具，在多元变量的空间插值或预测等方面具有重要作用。本文为相关原理的基本介绍。〖原文〗 Yamagata, Y. and Seya, H. (eds) (2020) Spatial analysis using big data: methods and urban applications. London, United Kingdom ; San Diego, CA: Academic Press, an imprint of Elsevier (Spatial econometrics and spatial statistics). Chapter 6 1 引言 1.1 全局空间最小二乘回归的问题在地学空间分析中，nnn 组观测数据通常 ...

利用合成地图为历史地图文本检测生成无限训练数据

发表于2022-10-27|GeoAIGeoAI

【摘要】许多历史地图页可公开用于需要长期历史地理数据的研究。这些地图的制图设计包括地图符号和文字标签的组合。从地图图像中自动读取文本标签可以大大加快地图解释速度，并有助于生成描述地图内容的丰富元数据。已经提出了许多文本检测算法来自动定位地图图像中的文本区域，但大多数算法都是在域外数据集（例如风景图像）上训练的。训练数据决定了机器学习模型的质量，而在地图图像中手动标注文本区域既费力又费时。另一方面，现有的地理数据源，例如 OpenStreetMap (OSM)，包含机器可读的地图图层，这使我们可以轻松地分离出文本图层并获得文本标签注释。但是，OSM 地图瓦片和历史地图之间的制图风格明显不同。本文提出了一种自动生成无限量带注释的历史地图图像的方法，用于训练文本检测模型。我们使用样式转换模型将当代地图图像转换为历史样式并在其上放置文本标签。我们表明，最先进的文本检测模型（例如 PSENet）可以从合成历史地图中受益，并在历史地图文本检测方面取得显著改进。【原文】Zekun Li, Runyu Guan, Qianmu Yu, Yao-Yi Chiang, and Crai ...

2021 年GeoAI 研讨会总结

发表于2022-10-27|GeoAI概览

【摘要】许多历史地图页可公开用于需要长期历史地理数据的研究。这些地图的制图设计包括地图符号和文字标签的组合。从地图图像中自动读取文本标签可以大大加快地图解释速度，并有助于生成描述地图内容的丰富元数据。已经提出了许多文本检测算法来自动定位地图图像中的文本区域，但大多数算法都是在域外数据集（例如风景图像）上训练的。训练数据决定了机器学习模型的质量，而在地图图像中手动标注文本区域既费力又费时。另一方面，现有的地理数据源，例如 OpenStreetMap (OSM)，包含机器可读的地图图层，这使我们可以轻松地分离出文本图层并获得文本标签注释。但是，OSM 地图瓦片和历史地图之间的制图风格明显不同。本文提出了一种自动生成无限量带注释的历史地图图像的方法，用于训练文本检测模型。我们使用样式转换模型将当代地图图像转换为历史样式并在其上放置文本标签。我们表明，最先进的文本检测模型（例如 PSENet）可以从合成历史地图中受益，并在历史地图文本检测方面取得显著改进。【原文】 Lunga, D., Hu, Y., Newsam, S., Gao, S., Martins, B., Ya ...

空间变系数模型的新旧方法

发表于2022-05-30|GeoAI空间变系数模型

【摘要】本文比较了空间异质性建模中空间变化参数模型的一些主要方法，其中包括：（1）21 世纪前提出的传统方法，包括：空间展开模型、空间自适应滤波模型和地理加权回归模型。（2）21 世纪初以来出现的一些新方法，包括：空间平滑过渡自回归模型、空间高斯过程模型、含自回归过程的随机参数模型。（3）一些通用变参数模型方法在空间异质性建模中的应用，包括：空间样条方法等。文中采用人工合成数据，以图形方式展示了不同方法之间的差异。注意：不知为何原因，本文未提及空间滤波方法。【原文】 D. M. Lambert, “Old and new approaches for spatially varying coefficient models,” Review of Regional Studies, vol. 51, no. 2, pp. 113–128, 2021, doi: 10.52324/001c.27969. 《空间回归模型综述》一文对面元数据的空间回归模型进行了综述，总体分为全局空间回归模型和局部空间回归模型，文中也谈到全局空间回归模型重点讨论邻近的目标变量、因变量、以及 ...

空间局部化思维对于统计和社会的重要性

发表于2022-05-28|GeoAI空间变系数模型

【摘要】在过去的二十年里，越来越多的注意力集中在局部形式的空间分析上，无论是在描述性统计还是空间建模方面，我们称之为 “局部化思维”。局部化思维的基础在于：全局空间分析方法可能不适用，并且待测量的条件关系存在随空间变化的情况。本文不仅研究了局部化思维对空间过程建模的影响，而且更广泛地考察了人们对空间行为的理解。我们首先简要调查了局部统计建模的原因；然后描述一种局部建模框架（多尺度地理加权回归），以展示局部模型中的基本概念和此类模型的输出类型；之后，我们研究了局部方法对统计分析的影响，重点是局部模型与空间回归模型相比的作用、局部模型的诊断、局部方法如何与困扰空间分析数十年的空间尺度问题相关联等问题；最后，我们将注意力转向空间局部建模方法对社会的影响，讨论了可复制性以及如何使用空间局部模型来测量以前无法测量的基于地点的效应。文中通过一个房价影响因素的实例来证明在整篇论文中提出的问题。【原文】 A. S. Fotheringham and M. Sachdeva, Spatial Statistics, vol. 50, p. 100601, 2022, doi: 10 ...