1 空间过程及平稳性假设

  • 《随机过程与随机场》 : 将空间表面(Surface)视为空间随机过程的一次实现,并将点参考数据视为空间表面的一次不完整观测,是研究点参考数据的基本假设。在此假设下,构成空间数据集的 nn 个具有地理参考的观测值集合,并不代表大小为 nn 的样本,而是代表了对一次随机实验的不完整观测,是一个来自 nn 维分布的大小为 11 的样本。这种假设对于理解点参考数据的统计模型非常重要,也同时使传统基于重复观测的统计方法失效。本文介绍了这种假设以及相关的概念和知识。该文中还有部分关于空间连续性和可微性的讨论,之前认为不重要,但后来细品一下可能涉及点参考数据和面元数据之间的转换问题,将来有时间可以配合《随机偏微分方程方法: 高斯场和高斯马尔可夫随机场之间的明确联系》 进一步理解。

2 经典克里金方法

  • 点参考数据及克里金法(2005) : 本文介绍了传统地统计学中的克里金方法。该方法发源于 1940 年代的地统计学领域,主要用于解决插值问题,因 Krige 1960 年的一篇硕士论文而命名。克里金法是一种基于高斯过程假设的经验估计和预测方法,建立在 变异函数(协方差函数)克里金预测 两个核心概念基础上,已经形成了一套成熟的技术体系。

  • Gelfand 等 2010 年 《空间统计手册》 的第三章 : 与上文内容相似,主要包括半变异函数的建模、推断和克里金预测。

3 现代贝叶斯建模分析

在 1990s 年代及以后,随着贝叶斯推断技术的进步和实用化,高斯过程的贝叶斯推断和预测方法得到了快速发展,并被称为 高斯过程回归,其中协方差函数(也称核函数、相关函数,在克里金法中习惯于采用半变异函数)的选择,则被视为一个机器学习问题。

(1)贝叶斯分层建模思想

  • Haining 等 2020 年的 《空间思维及贝叶斯方法》:本文重点介绍了时空数据分析中的统计思维,以及采用贝叶斯方法在空间统计思维中的重要性和作用,有助于读者理解采用贝叶斯方法的前因后果。

  • Gelfand 等 2017 年的《空间过程的贝叶斯建模分析方法综述》 : 系统地介绍了空间随机过程的贝叶斯建模和分析方法,除简述克里金法外,重点综述了近 20 年空间点参考数据建模的最新进展,其中涉及单变量建模、多变量(协同)建模、数据同化与融合、时空数据建模、大 N 问题等。

  • Gelfand 等 2010 年《空间统计手册》的第七章 《空间数据的贝叶斯分层建模》

(2)高斯过程模型的推断与选择

  • Gelfand 等 2010 年《空间统计手册》的第四章 《基于似然的方法》。在空间统计学中,点参考数据模型通常采用高斯过程(场)建模,而超参数的推断则可以采用频率派方法(如:最大似然估计)或贝叶斯方法。无论哪种推断方案,似然都是主要代价函数。本文主要介绍常见一些常见的似然函数,包括:完全条件似然、受限最大似然、组合似然近似估计以及近似似然的渐进特性分析等内容。本文内容摘自 Gelfand 的 《空间统计手册》第四章。

  • Raussman 等 2006 年《Gaussian processes for machine learning》的第五章。《高斯过程模型选择与自适应超参数》: 空间点参考数据的现代贝叶斯建模分析建立在高斯过程推断基础之上,上述文献大多侧重于空间随机过程的建模和预测(或插值),涉及模型选择和推断方法的讨论较少,本文重点在此。

4 空间变系数过程模型

Gelfand 2003 的 《空间变系数过程模型》:在大多数空间过程模型中,均值函数是一个代表空间相关性的回归模型,通常假设其回归系数在研究区域内保持不变;而这篇文章则认为,让回归系数能够随着空间发生变化会更为自然和灵活。这种思想与多项式建模、样条建模等同样具备灵活建模能力的方法相比,具备更好的可解释性。

可用软件包:

6 大 n 问题及其解决办法

参考 《点参考大数据处理方法索引帖》

7 与深度学习的结合

参考 《空间统计深度学习索引帖》

8 空间随机模拟