分类: GeoAI | 西山晴雪的知识笔记

发表于2022-11-28|GeoAI大数据专题点参考数据

原文： Finley, A. O., Banerjee, S., & E.Gelfand, A. (2015). SpBayes for Large Univariate and Multivariate Point-Referenced Spatio-Temporal Data Models. Journal of Statistical Software, 63(13). https://doi.org/10.18637/jss.v063.i13 Andrew O. Finley，密歇根州立大学Sudipto Banerjee，加州大学洛杉矶分校Alan E. Gelfand，杜克大学 1 模型框架的定义贝叶斯高斯空间回归模型是一个分层建模框架： $$p(\boldsymbol{\theta}) \times \mathcal{N}(\boldsymbol{\beta} | \boldsymbol{\mu}{\beta},\Sigma{\beta}) \times \mathcal{N}(\boldsymbol{\alpha} | 0,...

Cressie 的最新空间统计论述

发表于2022-11-23|GeoAI综述类

【阅读建议】本文是 Cressie 在 2021 年新撰写的一篇综述类文章，其主要看点包括：（1）用统一的形式化框架实现了点参考数据、面元数据、点模式数据的建模；（2）对多变量空间统计建模的统一形式化；（3）大数据的空间离散化处理方法（此处尚未理解其优势所在，需要进一步阅读引用的论文）；【摘要】空间统计是一个致力于与空间标签相关数据统计分析的研究领域。地理学家通常将 “位置信息” 与 “属性信息” 联系起来，并且定义了一个被称为 “空间分析” 的研究领域。许多操作空间数据的方法都是由算法驱动的，缺少与之相关的不确定性量化。如果空间分析是统计的（即结合了不确定性量化），则它属于空间统计的研究范畴。空间统计模型的主要特征是邻近的属性值比远处的属性值在统计上更相关，这也被称为地理学第一定律。【原文】 N. Cressie and M. T. Moores, “Spatial Statistics,” 2021, doi: 10.48550/ARXIV.2105.07216. 【参考】 1...

空间变系数过程模型

发表于2022-11-20|GeoAI点参考数据空间变系数模型

【摘要】许多应用的目标是建立一套回归模型，以便在空间相关性假设下对感兴趣区域上的响应变量作出解释。在几乎所有这些工作中，回归系数都假定为在该区域内恒定。但在某些应用中，预测系数会在局部或子区域水平上有所不同，而这种情形正是本文的重点。尽管空间表面（ Surface ）的参数化建模是可能的（如多项式表面建模、样条建模等），但我们认为将其视为空间随机过程的一次实现更为自然和灵活。在本文中，我们展示了在高斯响应背景下，如何对这种建模方法进行形式化，使其能够在随机效应和残差分析方面提供更有吸引力的解释。我们还提供了广义线性模型和时空场景的扩展。文中将在单户住宅售价数据集上展示静态和动态建模和解释能力。【参考】 Gelfand, A. E., Kim, H.-J., Sirmans, C. F., & Banerjee, S. (2003). Spatial modeling with spatially varying coefficient processes. Journal of the American Statistical Association,...

空间随机场及其建模方法

发表于2022-11-18|GeoAI综述类

【摘要】空间数据集通常被分为三种类型：点参考数据、面元数据和点模式数据，本文重点介绍点参考数据的建模基础–空间随机场，讨论了空间随机场的一些基本假设和性质，及其形式化定义。【原文】 O. Schabenberger and C. A. Gotway, Chapter 2，Statistical methods for spatial data analysis. Boca Raton: Chapman & Hall/CRC, 2005. 1 随机过程与随机场（1）随机过程与随机场随机过程是随机变量族或集合，其成员可以根据某种度量来识别或索引。例如：时间序列 $Y (t)，t = t_1,\ldots,t_n$ 由观测该序列的时间点 $t_1,\ldots,t_n$ 索引。空间过程也是随机变量的集合，只是其中的随机变量由包含空间坐标 $\mathbf{s} =[s_1,s_2, ···,s_d]^\prime$ 的某个集合 $D \subset \mathbb{R}^d$ 索引。对于平面内的一个过程，即...

多尺度地理加权回归

发表于2022-11-15|GeoAI空间变系数模型

其中 $n$ 表示样本大小，$\hat{\sigma}$ 定义为误差项的标准差，$\operatorname{tr}(\boldsymbol{S})$ 是帽子矩阵的迹。选定带宽后，可以进一步计算权重，并在每个校准位置拟合 GWR 模型，以获得一组局部系数。通过取每个校准位置的局部 $R^{2}$ 的平均值，可以获得 GWR 模型的总体 $R^{2}$ 值。【原文】 Fotheringham, A. Stewart and Yang, Wenbai and Kang, Wei. Multiscale Geographically Weighted Regression (MGWR) 2017. Annals of the American Association of Geographers , Vol. 107, No. 6 p. 1247-1265. 【阅后感】 ...

贝叶斯分层模型

发表于2022-11-13|GeoAI点参考数据空间贝叶斯方法

【摘要】本文简要介绍了贝叶斯分层建模方法的概念、优势和局限性。【原文】 N. Cressie, chapter 2, Statistics for spatio-temporal data. 2011. 核心内容快速浏览（1）贝叶斯全概率公式贝叶斯全概率公式允许将随机变量的联合分布分解为一系列条件分布： $$[A, B, C] = [A | B, C][B | C][C]$$ 其中 “$[ \cdot ]$” 用于表示概率分布；例如，$[A, B, C]$ 是随机变量 $A$、$B$ 和 $C$ 的联合分布，而 $[A | B, C]$ 是给定 $B$ 和 $C$ 时 $A$ 的条件分布。（2）Berlinear 的贝叶斯分层模型 (BHM) 范式 Mark Berliner （Berliner，1996）是最早使用贝叶斯全概率公式分解来为复杂过程建模的人。也就是说，联合分布 $[\text{data}, \text{process},\text{parameters}]$，可以自顶向下分解为三个层次: 数据模型：在假设下层的 “真实”...

空间过程的贝叶斯建模分析方法综述

发表于2022-11-11|GeoAI点参考数据

【阅读建议】本文重点介绍点参考空间数据的贝叶斯建模和分析方法，尤其是贝叶斯分层建模框架。点参考数据（也被称为地统计数据）主要指在固定空间位置观测到的随机变量数据。过去二十年中，此类数据在空间和时间上的收集量已经大大增加，随之而来的是分析此类数据的大量方法。本文尝试对其中的贝叶斯方法进行回顾。此类分析方法的好处是能够进行全面而准确的推断，并对不确定性进行适当评估。地统计建模的测站数据虽然比较复杂，涉及单变量和多变量、连续型和类别型、静态和动态以及大量长时间观测结果等，但在贝叶斯分层模型框架内，可以统一进行描述和阐释。本文另一亮点在于对大规模观测数据的建模问题做了综述，介绍了降秩方法（高斯预测过程模型）和近邻方法（近邻高斯过程模型）两类主要的处理策略。【引文信息】 A. E. Gelfand and S. Banerjee, “Bayesian Modeling and Analysis of Geostatistical Data,” Annu Rev Stat Appl, vol. 4, pp. 245–266, 2017, doi:...

空间数据贝叶斯建模方法索引帖

发表于2022-11-11|GeoAI空间贝叶斯方法

基础点参考数据面元数据点模式数据

地理加权回归模型

发表于2022-11-10|GeoAI空间变系数模型

〖摘要〗空间异质性是地理学第二定律的核心。从地理信息科学角度，空间异质性主要包含两种类型，一是随空间变化，空间某些变量之间的关系发生了明显变化；二是随空间变化，空间某些变量的统计量（如：均值、方差）会出现平稳或者不平稳的变化。地理加权回归是空间计量学、地理空间统计学中为研究第一种空间异质性（即变量间关系的空间异质性）而提出的工具，在多元变量的空间插值或预测等方面具有重要作用。本文为相关原理的基本介绍。〖原文〗 Yamagata, Y. and Seya, H. (eds) (2020) Spatial analysis using big data: methods and urban applications. London, United Kingdom ; San Diego, CA: Academic Press, an imprint of Elsevier (Spatial econometrics and spatial statistics). Chapter 6 1 引言1.1 全局空间最小二乘回归的问题在地学空间分析中，$n$...

利用合成地图为历史地图文本检测生成无限训练数据

发表于2022-10-27|GeoAIGeoAI

【摘要】许多历史地图页可公开用于需要长期历史地理数据的研究。这些地图的制图设计包括地图符号和文字标签的组合。从地图图像中自动读取文本标签可以大大加快地图解释速度，并有助于生成描述地图内容的丰富元数据。已经提出了许多文本检测算法来自动定位地图图像中的文本区域，但大多数算法都是在域外数据集（例如风景图像）上训练的。训练数据决定了机器学习模型的质量，而在地图图像中手动标注文本区域既费力又费时。另一方面，现有的地理数据源，例如 OpenStreetMap (OSM)，包含机器可读的地图图层，这使我们可以轻松地分离出文本图层并获得文本标签注释。但是，OSM 地图瓦片和历史地图之间的制图风格明显不同。本文提出了一种自动生成无限量带注释的历史地图图像的方法，用于训练文本检测模型。我们使用样式转换模型将当代地图图像转换为历史样式并在其上放置文本标签。我们表明，最先进的文本检测模型（例如 PSENet）可以从合成历史地图中受益，并在历史地图文本检测方面取得显著改进。【原文】Zekun Li, Runyu Guan, Qianmu Yu, Yao-Yi Chiang, and...