1 综述类

自行整理的 《空间回归模型综述》: 空间回归模型是按照空间区位研究变量之间关系的主要数学工具。根据回归模型是否存在局部空间同质特征(或反之空间异质性),通常可以将空间回归模型划分为 全局空间回归模型局部空间回归模型

Fotheringham 2022 年的 《空间局部化思维对于统计和社会科学的重要性》: 在过去的二十年里,越来越多的注意力集中在局部形式的空间分析上,无论是在描述性统计还是空间建模方面,我们称之为 “局部化思维”。局部化思维的基础在于:全局空间分析方法可能不适用,并且待测量的条件关系存在随空间变化的情况。本文不仅研究了局部化思维对空间过程建模的影响,而且更广泛地考察了人们对空间行为的理解。我们首先简要调查了局部统计建模的原因;然后描述一种局部建模框架(多尺度地理加权回归),以展示局部模型中的基本概念和此类模型的输出类型;之后,我们研究了局部方法对统计分析的影响,重点是局部模型与空间回归模型相比的作用、局部模型的诊断、局部方法如何与困扰空间分析数十年的空间尺度问题相关联等问题;最后,我们将注意力转向空间局部建模方法对社会的影响,讨论了可复制性以及如何使用空间局部模型来测量以前无法测量的基于地点的效应。文中通过一个房价影响因素的实例来证明在整篇论文中提出的问题。

Lambert 2021 年的 《空间变系数模型的新旧方法比较》: 本文比较了空间异质性建模中空间变化参数模型的一些主要方法,其中包括:(1)21 世纪前提出的传统方法,包括:空间展开模型、空间自适应滤波模型和地理加权回归模型。(2)21 世纪初以来出现的一些新方法,包括:空间平滑过渡自回归模型、空间高斯过程模型、含自回归过程的随机参数模型。(3)一些通用变参数模型方法在空间异质性建模中的应用,包括:空间样条方法等。文中采用人工合成数据,以图形方式展示了不同方法之间的差异。注意:不知为何原因,本文未提及空间滤波方法。

Sachdeva 2022 年的 《采用 “空间变化过程建模” 还是 “非线性建模” ?》: 在各种类型的局部统计模型的校准中获得的空间变化参数估计的研究是司空见惯的。这种估计的变化通常用空间变化过程来解释。本文强调,在将这种变化与空间变化过程相关联之前,应先检查非线性方面的空间变化参数估计的另一种解释。这可以通过描述和演示的简单筛选程序来实现,并且可以轻松应用于任何局部模型的结果。突出显示问题并展示解决方案,使用一组模拟数据,然后使用真实世界的数据集。该论文还强调了相反的情况,即当实际关系是线性但空间变化时,GAM 的不当应用会产生虚假的非线性结果。

2 地理加权回归模型

自编的 《地理加权回归模型》: 空间异质性是地理学第二定律的核心。从地理信息科学角度,空间异质性主要包含两种类型,一是随空间变化,空间某些变量之间的关系发生了明显变化;二是随空间变化,空间某些变量的统计量(如:均值、方差)会出现平稳或者不平稳的变化。地理加权回归是空间计量学、地理空间统计学中为研究第一种空间异质性(即变量间关系的空间异质性)而提出的工具,在多元变量的空间插值或预测等方面具有重要作用。本文为相关原理的基本介绍。

Fotheringham 2017 年的 《多尺度地理加权回归》: 本文作者是地理加权回归方法的提出者之一,也是《地理加权回归:空间可变关系的分析》一书的作者。在提出地理加权回归十余年后,作者发现原来的方法对于尺度缺乏建模能力(即解释变量可能来自于不同尺度的空间数据),进而深入研究了与尺度结合的地理加权回归,提出了自己的一套新方法。

Li 2019 年的《快速地理加权回归(FastGWR)》: 地理加权回归 (GWR) 是一种广泛使用的工具,用于探索地理空间过程的空间异质性。 GWR 计算特定位置的参数估计值,这使得其校准过程需要大量计算。当前开源 GWR 软件可以处理的最大数据点数是标准桌面上的大约 $15,000$ 个观测值。在大数据时代,这严重限制了 GWR 的使用。为了克服这一限制,我们提出了一种高度可扩展的开源 FastGWR 实现,该实现基于 Python 和消息传递接口 (MPI),可扩展到数百万个观测值的数量级。 FastGWR 优化内存使用以及并行化以显著提高性能。为了说明 FastGWR 的性能,对来自洛杉矶市 Zillow 数据集的大约 $130$ 万个单户住宅物业进行了特征房价模型校准,这是将 GWR 应用于这种规模的数据集的首次尝试。结果表明,随着高性能计算 (HPC) 环境中内核数量的增加,FastGWR 呈线性扩展。它还优于当前可用的开源 GWR 软件包,在标准桌面上速度大幅降低——最高可达数千倍。

3 空间滤波模型

Yamagata 2020 年的 《空间滤波方法概述》: 本文关注的重点是特征向量空间滤波方法(Eigenvectors Spatial Filtering, 特征向量空间滤波)。这是一种方法已广泛应用于地理学、区域科学、城市研究、经济学、生态学和流行病学等诸多领域的局部空间异质性建模方法。与地理加权回归方法探求回归系数背后的空间模式不同,空间滤波方法旨在检测空间数据中残差的空间模式。本文将介绍特征向量空间滤波方法的基础理论和扩展方法,并且讨论应用此方法时需要考虑和避免的问题。

Murakami 2019 年的 《基于空间滤波的大型数据集空间变系数建模》: 虽然空间变系数建模在应用科学中很流行,但其计算负担很大。如果考虑空间变系数的多尺度属性,则尤其如此。鉴于此背景,本研究开发了一种基于 Moran 特征向量的空间变系数 (M-SVC) 建模方法,可有效地估计多尺度空间变系数模型。该估计通过 (1) 秩降低、(2) 预压缩和 (3) 顺序似然最大化来加速。步骤 (1) 和 (2) 从似然函数中消除样本大小 N;在这些步骤之后,似然最大化成本与 N 无关。步骤 (3) 进一步加速似然最大化,因此即使空间变系数的数量 K 很大,也可以估计多尺度空间变系数模型。通过蒙特卡罗模拟实验将 M-SVC 方法与地理加权回归 (GWR) 进行比较。这些模拟结果表明,当 N 很大时,本文方法比地理加权回归快得多,尽管数值估计了 2K 个参数,而地理加权回归仅数值估计了 1 个参数。然后,将所提出的方法应用于土地价格分析作为说明。开发的空间变系数估计方法在 R 包 “spmoran” 中实现

Islam 2022 年的 《基于空间滤波方法的机器学习模型》: 空间统计模型对于地理空间数据建模非常有效,因为它们考虑了地理空间和其他非空间协变量的空间信息,使它们能够通过解决空间依赖性来最小化空间自相关。相比之下,机器学习模型在预测非空间数据方面非常有效,但由于空间自相关问题,它们在建模和预测地理空间数据方面效果不佳。在用于地理空间数据建模的机器学习模型中,经常出现的局限性之一是没有将地理空间的空间信息融合到模型中的标准方法,因此机器学习模型中无法最小化空间自相关。

4 贝叶斯变系数模型

Gelfand 2003 年的 《贝叶斯空间变系数模型》: 许多应用的目标是建立一套回归模型,以便在空间相关性假设下对感兴趣区域上的响应变量作出解释。在几乎所有这些工作中,回归系数都假定为在该区域内恒定。但在某些应用中,预测系数会在局部或子区域水平上有所不同,而这种情形正是本文的重点。尽管空间表面( Surface )的参数化建模是可能的(如多项式表面建模、样条建模等),但我们认为将其视为空间随机过程的一次实现更为自然和灵活。在本文中,我们展示了在高斯响应背景下,如何对这种建模方法进行形式化,使其能够在随机效应和残差分析方面提供更有吸引力的解释。我们还提供了广义线性模型和时空场景的扩展。文中将在单户住宅售价数据集上展示静态和动态建模和解释能力。

Finley 2020 年的 《spBayes–贝叶斯空间变系数模型的 R 软件包》: 本文描述并说明了在 spBayes(版本 0.4-2)R 包中拟合空间变系数模型的新功能。新的 spSVC 函数使用计算效率高的马尔可夫链蒙特卡罗算法,并扩展了当前仅适用于空间变化截距回归模型的 spBayes 函数,以适用于回归设计矩阵中任何一组列的独立或多元高斯过程随机效应。讨论和说明了新添加的用于 spSVC 的 OpenMP 并行化选项,以及用于联合和逐点预测和模型拟合诊断的辅助函数。使用中欧的 PM10 分析说明了所提出模型的效用。

5 其他模型

Hagenauer 2021 年的 《地理加权人工神经网络》: 虽然最近的发展在许多方向上扩展了地理加权回归( GWR ),但通常假设因变量和自变量之间的关系是线性的。然而,在实践中,变量往往是非线性关联的。为解决该问题,荷兰乌特勒支大学 Hagenauer 等提出了一种地理加权人工神经网络( $GWANN$ )。 $GWANN$ 将地理加权与人工神经网络相结合,能够在无假设情况下以数据驱动方式学习复杂的非线性关系。通过已知空间特征的合成数据和真实世界案例研究,作者将 $GWANN$ 和 GWR 进行了比较。合成数据的结果表明,当数据之间关系是非线性且空间方差较大时, $GWANN$ 算法的性能要好于 GWR 算法,而基于真实数据的结果表明, $GWANN$ 算法在实际应用中也可以取得更好的性能。