高斯场和非高斯场的随机偏微分方程方法:10 年回顾
【摘 要】 高斯过程和随机场有着悠久的历史,包含了表示空间和时空相关结构的很多方法,例如:协方差函数、谱表示、再生核希尔伯特空间、基于图的模型等。本文介绍了随机偏微分方程方法(SPDE)如何通过 Hilbert 空间投影,将 Matern 协方差模型与其中几种方法建立起联系,并且每种联系在不同情况下都非常有用。除了主要思想的概述之外,本文还讨论了一些重要的扩展、理论、应用和其他新发展。这些方法包括:马尔可夫模型、非马尔可夫模型、非高斯随机场、非平稳场、任意流形上的时空场等,以及实际计算需要考虑的因素。
【原 文】 Lindgren, F., Bolin, D. and Rue, H. (2022) ‘The SPDE approach for Gaussian and non-Gaussian fields: 10 years and still running’, Spatial Statistics, 50, p. 100599. Available at: https://doi.org/10.1016/j.spasta.2022.100599.
1 简介
关于高斯场 ...
高斯过程预测的 Vecchia 近似
〖摘 要〗 高斯过程 (GP) 是用于地理空间分析、非参数回归和机器学习的高度灵活的函数估计器,但它们在计算上对大型数据集不可行。 高斯过程的 Vecchia 近似已被用于快速估算参数推断的似然。本文研究了在已观测和未观测位置处进行空间预测时的 Vecchia 近似,包括在大型位置集上获得联合预测分布。我们考虑了用于高斯过程预测的通用 Vecchia 框架,其中包含一些新的和已有的特例。我们从理论和数值上研究了这些方法的准确性和计算特性,并且证明了新方法表现出在空间位置总数上的线性计算复杂性。我们表明,框架内的某些选择会对不确定性量化和计算成本产生强烈影响,从而就哪些方法最适合各种设置提出具体建议。我们还将方法应用于叶绿素荧光卫星数据集,表明新方法比现有方法更快或更准确,并削减了预测结果图中不符合实际的伪影。
〖原 文〗 Katzfuss, M. et al. (2020) ‘Vecchia approximations of Gaussian-process predictions’, Journal of Agricultural, Biological and Env ...
Vecchia 近似似然法的通用框架
【摘要】 高斯过程通常用作函数、时间序列和空间场的模型,但它们对大型数据集在计算上不可行。着眼于高斯过程加上加性噪声项的数据建模典型设置,本文提出了 Vecchia (1988) 方法的泛化作为高斯过程近似的框架。我们展示的通用 Vecchia 方法包含了现有许多流行的高斯过程近似特例,并且允许在统一框架内比较不同方法。通过有向无环图模型,我们确定了推断所需矩阵的稀疏性,从而对计算特性有了新的认识。基于这些结果,我们提出了一种新的稀疏通用 Vecchia 近似,它确保了大型空间数据集的计算可行性,但可以产生比原始 Vecchia 方法近似精度更好的结果。文中提供了几个理论结果并进行了数值比较。
【原文】 Katzfuss, M. and Guinness, J. (2021) ‘A general framework for Vecchia approximations of Gaussian processes’, Statistical Science, 36(1). Available at: https://doi.org/10.1214/19-STS755.
1 ...
Vecchia 近似似然法
〖摘 要〗 介绍了连续域空间过程的参数估计(指均值函数的参数估计)和模型识别(指残差对应的空间过程模型识别)程序。在本文中,空间过程被假定为具有残差的线性模型,且残差服从二阶平稳高斯随机场,同时假定数据由任意采样位置处空间过程的含噪声观测值组成。本文采用了具有椭圆等值线的二维有理密度函数对空间协方差函数进行建模,文中提出的迭代式估计方法可以减轻非格元数据中常规最大似然估计的许多计算困难。
〖原 文〗 Vecchia, A.V. (1988) ‘Estimation and Model Identification for Continuous Spatial Processes’, Journal of the Royal Statistical Society: Series B (Methodological), 50(2), pp. 297–312. Available at: https://doi.org/10.1111/j.2517-6161.1988.tb01729.x.
1 引言
1.1 背景
令 {Z(x,y)}\{Z(x, y)\}{Z(x,y)} 为一 ...
🔥 空间变系数模型索引帖
1 综述类
自行整理的 《空间回归模型综述》: 空间回归模型是按照空间区位研究变量之间关系的主要数学工具。根据回归模型是否存在局部空间同质特征(或反之空间异质性),通常可以将空间回归模型划分为 全局空间回归模型 和 局部空间回归模型。
Fotheringham 2022 年的 《空间局部化思维对于统计和社会科学的重要性》: 在过去的二十年里,越来越多的注意力集中在局部形式的空间分析上,无论是在描述性统计还是空间建模方面,我们称之为 “局部化思维”。局部化思维的基础在于:全局空间分析方法可能不适用,并且待测量的条件关系存在随空间变化的情况。本文不仅研究了局部化思维对空间过程建模的影响,而且更广泛地考察了人们对空间行为的理解。我们首先简要调查了局部统计建模的原因;然后描述一种局部建模框架(多尺度地理加权回归),以展示局部模型中的基本概念和此类模型的输出类型;之后,我们研究了局部方法对统计分析的影响,重点是局部模型与空间回归模型相比的作用、局部模型的诊断、局部方法如何与困扰空间分析数十年的空间尺度问题相关联等问题;最后,我们将注意力转向空间局部建模方法对社会的影响,讨论了可复制 ...
近似受限似然方法
〖摘 要〗 由于计算负担,似然法通常难以用于大型、位置不规则的空间数据集。即使对于高斯模型,精确计算 nnn 个观测值的似然也需要 O(n3)\mathcal{O}(n^3)O(n3) 运算。任何联合密度都可以写成基于某些观测顺序的条件密度之积,因此一种减少计算的方法是在计算上述条件密度时,仅以部分的 “过去” 观测为条件。本文重点探讨了此类方法如何应用于受限似然的近似,特别展示了如何利用 估计方程方法 判断近似的有效性。此外,过前的工作通常建议以当前观测的历史最近邻观测为条件,但我们通过理论、数值和实例表明,以一些远距离的观测为条件,通常也可以带来相当大的好处。
〖原 文〗 Stein, M.L., Chi, Z. and Welty, L.J. (2004) ‘Approximating likelihoods for large spatial data sets’, Journal of the Royal Statistical Society: Series B (Statistical Methodology), 66(2), pp. 275–296. A ...
SPDE: 高斯场和高斯马尔可夫随机场之间的明确联系
【摘 要】 连续索引的高斯场 (GF) 是空间统计建模和地统计学中最重要的组成部分,通过协方差函数的定义给出了场性质的直观解释。在计算方面,高斯场受到大 nnn 问题限制,因为密集矩阵的分解计算成本是维度的三次方(O(n3)\mathcal{O}(n^3)O(n3))。尽管当前计算能力处于历史最高水平,但这一事实似乎仍然是许多应用中的瓶颈。与高斯场同样中要的,还有一类离散索引的高斯马尔可夫随机场 (GMRF),其马尔可夫性质导致精度矩阵的稀疏性,从而使我们可以使用稀疏矩阵的数值算法。对于 R2\mathbb{R}^2R2 中的场, GMRF 仅使用了一般算法所需时间的平方根(O(n3)\mathcal{O}(\sqrt{n^3})O(n3))。 GMRF 由其完整条件分布分布定义,但在这种参数化形势下,其边缘分布性质并不明确。在本文中,我们展示了:对于 Matérn 类型的某些高斯场,(线性)随机偏微分方程的近似随机弱解,可以为 Rd\mathbb{R}^dRd 上的任何三角形剖分提供在高斯场和 GMRF 之间的显式链接,进而可以将该高斯场表示为基函数的形式。其好处是:我 ...
固定秩克里金法
【摘 要】 非常大的空间数据集的空间统计具有挑战性。数据集的大小 nnn 会导致计算最优空间预测变量(例如克里金法)出现问题,因为其计算成本为 nnn 的三次方。此外,大型数据集通常是在大型空间域上定义,因此感兴趣的空间过程通常在该域上表现出非平稳行为。 通过使用一组固定数量的基函数,可以定义一个灵活的非平稳协方差函数族,这产生了我们称为 “固定秩克里金法” 的空间预测方法。具体来说,固定秩克里金法就是此类非平稳协方差函数支撑下的克里金法。当 nnn 非常大时,它依赖于计算简化,以获得隐空间过程的空间最佳线性无偏预测器及其均方预测误差。基于最小化加权 Frobenius 范数的方法产生协方差函数参数的最佳估计量,然后将其代入固定秩克里金方程。新方法适用于在整个地球上观测到的非常大的臭氧数据集,其中 nnn 约为数十万。
【原 文】 Cressie, N. and Johannesson, G. (2008) ‘Fixed rank kriging for very large spatial data sets: Fixed Rank Kriging’, Journal o ...
基于空间滤波的大型数据集空间变系数建模
〖摘 要〗 虽然空间变系数 (SVC) 建模在应用科学中很流行,但其计算负担很大。如果考虑空间变系数的多尺度属性,则尤其如此。鉴于此背景,本研究开发了一种基于 Moran 特征向量的空间变系数 (M-SVC) 建模方法,可有效地估计多尺度空间变系数模型。该估计通过 (1) 秩降低、(2) 预压缩和 (3) 顺序似然最大化来加速。步骤 (1) 和 (2) 从似然函数中消除样本大小 N;在这些步骤之后,似然最大化成本与 N 无关。步骤 (3) 进一步加速似然最大化,因此即使空间变系数的数量 K 很大,也可以估计多尺度空间变系数模型。通过蒙特卡罗模拟实验将 M-SVC 方法与地理加权回归 (GWR) 进行比较。这些模拟结果表明,当 N 很大时,本文方法比地理加权回归快得多,尽管数值估计了 2K 个参数,而地理加权回归仅数值估计了 1 个参数。然后,将所提出的方法应用于土地价格分析作为说明。开发的空间变系数估计方法在 R 包 “spmoran” 中实现
〖原 文〗 Murakami, D. and Griffith, D.A. (2019) ‘Spatially varying c ...
艺术、地理信息和数学之间存在惊人的接口
【摘 要】 地理与艺术或数学与艺术之间是否存在任何已知的协同作用,将所有这三个学科联系起来?地理人文和数学人文文献只描述了这两个单独的协同作用。一种新的定量地理学方法利用复杂的数学概念来分析遥感卫星图像,当扩展到艺术绘画时,它确实跨越了所有三个学科。组织概念是空间自相关,或者不相似/相似的颜色及其强度在绘画中聚集的趋势。本文总结了这一论点的论证,并具体应用于达芬奇、莫奈和伦勃朗的画作。它的主要贡献是,对于绘画的高地理分辨率数字版本,通过明智选择和组合的空间自相关分量构建的复制品与其原始来源的数字副本非常接近,进一步概括了文献中报道的某些近期发现。
【原 文】 Griffith, D.A. (2022) ‘Art, Geography/GIScience, and mathematics: A surprising interface’, Annals of the American Association of Geographers, 0(0), pp. 1–12. Available at: https://doi.org/10.1080/24694452.2022.2 ...