大型空间数据分析方法案例及评测
【摘 要】 高斯过程是空间数据分析人员不可或缺的工具。然而,“大数据” 时代的到来导致传统高斯过程在计算上对现代空间数据不可行。因此,已经提出了更适合处理大空间数据的完全高斯过程的多种替代方案。这些现代方法通常利用低秩结构和/或多核和多线程计算环境来促进计算。本研究首先介绍性地概述了几种分析大型空间数据的方法。然后,阐述了由不同组实施的方法之间的预测评测结果。具体来说,每个研究组都得到了两个训练数据集(一个模拟数据集和一个观测数据集)以及一组预测位置。然后,各组实现自己的方法,并在给定位置处生成预测,每组的成果都在公共计算环境中运行。然后根据各种预测诊断对这些方法进行了比较。有关方法和代码的实现细节的补充材料可在线。
【原 文】 M. J. Heaton et al., “A Case Study Competition Among Methods for Analyzing Large Spatial Data,” Journal of Agricultural, Biological and Environmental Statistics, vol. 24, no. ...
空间过程的贝叶斯建模分析方法综述
【阅读建议】 本文重点介绍点参考空间数据的贝叶斯建模和分析方法,尤其是贝叶斯分层建模框架。点参考数据(也被称为地统计数据)主要指在固定空间位置观测到的随机变量数据。过去二十年中,此类数据在空间和时间上的收集量已经大大增加,随之而来的是分析此类数据的大量方法。本文尝试对其中的贝叶斯方法进行回顾。此类分析方法的好处是能够进行全面而准确的推断,并对不确定性进行适当评估。地统计建模的测站数据虽然比较复杂,涉及单变量和多变量、连续型和类别型、静态和动态以及大量长时间观测结果等,但在贝叶斯分层模型框架内,可以统一进行描述和阐释。本文另一亮点在于对大规模观测数据的建模问题做了综述,介绍了降秩方法(高斯预测过程模型)和近邻方法(近邻高斯过程模型)两类主要的处理策略。
【引文信息】 A. E. Gelfand and S. Banerjee, “Bayesian Modeling and Analysis of Geostatistical Data,” Annu Rev Stat Appl, vol. 4, pp. 245–266, 2017, doi: 10.1146/annurev-s ...
点参考数据及克里金法
【阅读建议】 点参考数据的空间预测和模拟问题,大致有传统克里金法和目前应用比较广泛的基于似然的方法。本文主要介绍源于地统计学的传统克里金方法,一来掌握空间统计中的基础方法,二来便于与后面几篇文章中提到的高斯过程之间建立联系。克里金方法在对空间随机场作出本征平稳假设的情况下,利用参数化的变异函数对不同位置处随机变量的偏差之间存在的空间结构(相关性)进行建模,利用有限样本点的最大似然求解最优参数,并将其用于预测任务。
【引文信息】
[1] 史舟, 李艳编, 地统计学在土壤学中的应用. Beijing: Zhong guo nong ye chu ban she, 2006.
[2] 王政权, 地统计学及在生态学中的应用. Bei jing: Ke xue chu ban she, 1999.
1 引言
空间数据的获取通常具有一定的成本,是进行空间分析的基础与起源。为了提高研究结论的精度,我们希望能够获取研究区域内更多、更全面的精确空间属性数据信息。然而,在实际研究工作中,由于人力成本、资源等外部条件限制,我们无法对全部未知区域加以采样与测量,而往往只能得到研究区域内有限数量 ...