空间局部化思维对于统计和社会的重要性
【摘 要】 在过去的二十年里,越来越多的注意力集中在局部形式的空间分析上,无论是在描述性统计还是空间建模方面,我们称之为 “局部化思维”。局部化思维的基础在于:全局空间分析方法可能不适用,并且待测量的条件关系存在随空间变化的情况。本文不仅研究了局部化思维对空间过程建模的影响,而且更广泛地考察了人们对空间行为的理解。我们首先简要调查了局部统计建模的原因;然后描述一种局部建模框架(多尺度地理加权回归),以展示局部模型中的基本概念和此类模型的输出类型;之后,我们研究了局部方法对统计分析的影响,重点是局部模型与空间回归模型相比的作用、局部模型的诊断、局部方法如何与困扰空间分析数十年的空间尺度问题相关联等问题;最后,我们将注意力转向空间局部建模方法对社会的影响,讨论了可复制性以及如何使用空间局部模型来测量以前无法测量的基于地点的效应。文中通过一个房价影响因素的实例来证明在整篇论文中提出的问题。
【原 文】 A. S. Fotheringham and M. Sachdeva, Spatial Statistics, vol. 50, p. 100601, 2022, doi: 10.1016/j.spasta.2022.100601.
【作 者】 A. Stewart Fotheringham, Mehak Sachdeva. 亚利桑那州立大学地理科学与城市规划学院
1 空间局部化思考
科学研究的目标通常是发现一些关于事物为何如此的新事物。我们经常通过观测有关数据,并关注其随时间、空间或两者的变化来解答此问题。我们真正想知道的是哪些过程产生了这些数据,以及为什么观测到的值时高时低。为了回答此问题,我们经常构建一个我们认为能够产生观测数据的过程模型。在许多情况下(例如在物理和化学中),此类过程具有全局恒定性,因此单个模型被普遍的应用。但是,在某些情况下,所研究的过程在空间(或时间)上可能不恒定(特别是在那些涉及人类信仰、价值观、偏好和行为的社会科学领域中),无法制定一个具有普适性或全局性的模型。此时,“局部模型” 会相当具有吸引力。局部模型只是一个全局模型的某种空间(或时间或时空)解耦,允许模型参数在空间(或时间,或两者)上发生变化。
当然,如果被建模的过程确实随空间变化,那么全局模型的问题就会很明显。正如美国的每日平均气温隐藏了大量关于各地气温变化的重要信息,全局模型估计的参数不会产生任何参数所代表的过程随空间变化的信息。全局模型为所表示的每一个条件关系生成一个估计值,我们不知道它是否完全代表了局部过程,因为这些局部过程已经被平均为全局估计值。在过去的二十年里,大量研究工作投入到开发可能因地而异的空间过程模型上。目前已经出现了多种开发此类模型的框架,尽管这些框架有所区别,但所有局部模型都会产生相似的输出,并且都基于 “被建模过程可能不会在空间上保持恒定” 这一共同前提。
1.1 空间模型差异化的原因
鉴于此,我们有必要先考虑为何过程模型会关于空间变化?如果我们在局部空间测量一个过程,这些局部空间的测量可能会发生变化的原因有以下三个:
(1) 噪音
即便被测量的关系在空间上是全局恒定的,通过获取数据的子集并在每个子集上分别校准模型,我们总是会在局部校准中引入不同水平的噪声(采样差异),因此无法期望每个子集估计的参数都相同;
(2) 错误指定
遗漏变量或采用了不正确的函数形式会导致模型对现实的严重错误指定,如果这种错误指定具有空间偏差,则会导致模型的参数估计在空间上产生变化。例如,假设模型中省略了一个重要的解释变量,而该变量与模型中的现有响应变量高度相关,就会发生这种情况。同样,如果协变量与因变量具有非线性关系,但在模型中错误指定了两者之间的线性函数,则即使被测量的条件关系本身是平稳的,协变量的局部参数估计也可能表现出空间非平稳性(Sachdeva 等, 2021).
(3) 空间过程的非平稳性
出于某种原因,被建模的过程本身因空间而异。我们将在下面讨论,为什么在与人类行为相关的模型中最有可能会出现这种情况。
1.2 两个重要前提
在局部建模中,在将任何行为解释归因于局部变化的参数估计之前,必须解决两个问题。
(1)确保正确地推断
在局部建模中,必须确保正确的推断,尽量避免参数估计中所观测到空间变化,仅仅是由于样本不同的噪声变化引起的。
(2)确保未遗漏重要变量或正确函数形式
在局部建模中,需要仔细检查模型是否存在重大遗漏变量问题和正确的函数形式。只有当这两个问题都得到解决时,才应尝试对局部参数估计值进行任何行为解释。
1.3 可解释性
假设已经进行了适当的推断检验和模型检查,而局部参数估计值中仍然存在显著空间变化,那么我们应当如何解释这种变化?为什么某些测量数据值的决定因素会随空间变化?如果不能对此问题给出满意的答案,局部建模的基础就会受到质疑。
幸运的是,几十年来,众多跨社会科学学科的研究人员以 “空间上下文” (或简称 “上下文”)形式为局部建模提供了合适的理由(Agnew,1996;Beck 等,2002;Plaut 等,2002;Oreg 和 KatzGerro,2006;Walker 和 Li,2006;Enos,2017)。在这里,我们定义上下文来描述您的住所如何影响您的价值观、规范、信仰、态度、偏好,并最终影响您的行为,并且这与任何个人因素无关。从本质上讲,“空间上下文” 是位置对一个人行为的影响在很大程度上无法测量的简写术语。因此,“空间上下文” 是一个多方面的概念,包括局部媒体、家庭、朋友和当地组织的影响,以及传统观念、持续的不利或有利条件、习俗、生活方式和影响社会规范的地区共有的心理概况,这进而影响个体行为。“空间上下文” 的作用因选择性迁移和人们倾向于寻找志趣相投的人(同质性)或避免观点不同的人(仇外心理)而被放大,这一概念已被充分记录和研究(Sakoda,1971;Schelling,1971;Borchert,1972;Zelinsky,1992;Bishop,2009)。
尽管人们普遍认为 “上下文” 会影响人们的行为,而且 “上下文” 的影响会因地点而异,但关于它在决定行为中的作用仍然存在几个问题。
-
正如 Enos(2017 年)所说:
“没有人怀疑环境会影响行为,对邻里效应的研究强烈表明它确实存在。但上下文效应的确切性质(它们到底有多重要)对研究人员来说是难以捉摸的。”(第 120 页)
-
O’Loughlin(2018 年)也表达了这种观点:(第 148 页)
“但是,如果上下文仍然是政治地理学的口头禅,我们如何衡量它的重要性呢?”
-
Braha 和 de Aguiar(2017 年):(第 1 页)
“因此,如何分离和衡量社会影响的效应问题是理解集体人类行为的主要挑战。”
因此,空间上下文的作用证明了空间局部模型在跨空间进行人类行为分析时的合理性。但如下所示,空间局部模型反过来提供了一种方法,既可以将 “上下文” 的影响与社会经济因素的混杂影响分开,也可以衡量 “上下文” 在决定行为中的重要性。在此之前,社会科学家一直对这两者避而不谈。此外,局部模型中的 带宽
或 缩放参数
提供了有关上下文对行为产生影响的空间尺度信息。
2 空间局部建模
2.1 局部模型分类
在影响空间模式的过程中,具有空间变化特性的局部模型可以分为两大类:
(1)明确指定空间子集
此类模型需要对被检查过程中存在的空间变化有一些先验知识,通常需要分析人员指定可用数据的多个空间定义子集,并针对每个数据子集获取特定于每个地理关系(即过程)的参数估计值。典型示例是:多层次模型(Multilevel Models)
和 空间状态模型(spatial regime models)
(Anselin,1988 年;Duncan 等,1996 年,1998 年)。虽然这些区域模型的参数估计值变化的性质可能为地理关系的规模提供线索,但并没有提供过程尺度的明确衡量标准,并且需要先验地指定尺度。他们假设被建模的关系在每个预定义的数据子集中是恒定的,但在子集之间会有所不同,从而导致单元边界处的不连续性(Lloyd,2011)。
(2) 没有明确的空间子集
此类局部模型允许被建模过程中存在连续空间变化,并直接从数据中估计过程的异质性性质,而无需预先指定数据集群。这允许对过程中的任何空间异质性进行更灵活的分析。此类局部建模框架的示例包括:基于特征向量空间滤波的局部回归 (SFLR/ESF)
(Gelfand 等人,2003 年)、地理加权回归
(GWR)(Brunsdon 等人,1998 年;Fotheringham 等人,1998 年、2002 年;LeSage,2004 年)和 贝叶斯空间变系数 (SVC) 模型
(Banerjee 等人,2014 年;Gelfand 等人,2003 年)。
2.2 流行的局部模型
(1)基于空间滤波的模型
空间过滤 (SF) 方法涉及对合成变量的协变量进行回归,这些变量通过使用 Moran’s I 或类似的空间自相关度量来解释变量表面的空间自相关。特征向量空间滤波 (ESF) 遵循以下观测,即基于 Moran’s I(或等效度量)的适当加权空间连通性矩阵的特征向量代表(Griffith,2000:142),它是详尽地列出了观测的地理排列中的所有可能模式。因此,任何变量的空间模式都可以通过这组模式的某种线性组合来近似,并与空间部分分开。 (Griffith, 2008) 通过将预测变量与选定的特征向量项进行交互来扩展此基本线性模型,以实现空间变化参数估计的估计,从而使建模方法空间局部化。
(2)贝叶斯空间变系数模型
贝叶斯空间变系数 (SVC) 框架内的方法使用与相关混合效应模型非常相似的贝叶斯分层模型方法。模型中的全局平均响应效应是在层次结构的较低级别估计的,而特定地点的参数估计是在最高级别建模的(Gelfand 等人,2003 年)。
在这些技术中,SVC 和局部 ESF 是 “完全映射” 技术,因为它们会在单个回归中使用所有可用数据来获得一组特定于测点的参数估计值(Gelfand 等人,2003 年;Griffith,2008 年)。SVC 模型通常使用 Markov Chain Monte Carlo 算法进行估计,它们的实现通常比 GWR 模型更复杂 (Lloyd, 2011)。
(3)相关对比
可以在其他地方找到不同形式的空间局部模型的比较(Oshan 和 Fotheringham,2018 年;Wolf 等人,2018 年;Harris,2019 年;Murakami 等人,2019 年),在下文中,我们使用 GWR 框架作为演示者,主要是因为它在文献中的熟悉度和广泛使用,还因为它在概念上可以说更清晰模型如何捕获局部变化的行为
2.3 地理加权回归
地理加权回归 (GWR) 框架采用一组回归模型来表示在研究区域内每个位置运行的过程。在理想情况下,有足够的数据可供模型针对每个位置单独校准,但这种情况很少见。为了解决此问题,GWR 使用了一种技术,该技术基于应用于过程的 Tobler 空间依赖定律。 3 对于每个特定于位置的回归,使用平滑加权内核和优化的数据子集对位置周围的数据进行加权点(根据最近邻居的数量或取决于所选空间内核的距离阈值定义)以校准局部模型。因此,GWR 模型能够通过从附近位置借用和加权数据来为研究区域中的每个位置生成参数估计值。 GWR 模型的一般形式可以表示为等式。 (1):
yi = β0i + k ∑ j βj(ui,vi)xij + εi (1)
其中 xij 是位置 i 处的第 j 个协变量,βj(ui,vi) 是位置 (ui, vi) 处的第 j 个参数估计值,εi 是随机误差项,yi 是响应变量(Fotheringham 等人,2002 年)。特定于位置的参数估计值估计为:
βi = (X T WiX )−1 X T Wiy, i ∈ {1, 2, . . . , n} (2)
其中 X 是预测变量的 (n,k) 矩阵,y 是响应变量的 (n,1) 向量,Wi 是位置 i 的 (n,n) 对角空间加权矩阵。在等式中。 (2),加权内核和相应的带宽参数,假设对于模型中的所有协变量都是相同的。由于不同的过程可能会在空间上以独特的空间尺度发生变化,因此这种假设过于严格,并且已被多尺度 GWR (MGWR) 的发展所取代,它允许为内部的每个协变量估计唯一的带宽参数和随后的局部加权矩阵一个模型(Fotheringham 等人,2017 年)。 MGWR模型的一般形式可以表示为:
yi = β0i + k ∑ j βbwj(ui,vi)xij + εi (3)
其中 βbwj(ui,vi) 中的 bwj 表示协变量特定的带宽(Fotheringham 等人,2017)。
因此,MGWR 框架的关键特征是它为每个协变量生成一个明确的规模指标、带宽,因此是 GWR 的通用版本。事实上,GWR 可以被视为 MGWR 的一个特例,其中被建模的过程都在相同的空间尺度上变化。带宽参数描述了将 x 的变化与 y 的变化联系起来的条件过程变化的空间尺度。在特定于位置的回归中,与来自更远位置的数据相比,来自附近位置的数据的权重更高(权重假定最大值为 1),权重的下降率由带宽参数确定。小带宽(相对于数据点总数或跨研究区域的最大距离)表示更多的局部过程,而大带宽表示更多的区域甚至全局过程。可以在 (M)GWR 框架内使用双平方、高斯和指数函数等核函数的几个选项来控制加权矩阵的平滑行为,这些也可以是自适应的或固定的(参见 Fotheringham 等人,2002 年) ,了解更多详情)。
从概念上讲,(M)GWR 中最佳带宽的选择是偏差和方差之间的权衡。如果正在建模的关系在空间上发生变化,则随着带宽的增加,将在局部参数估计中引入更大的偏差,因为距离局部回归点更远的数据将由越来越不同的过程产生。然而,带宽越小,局部参数估计的不确定性就越大,因为局部模型将使用较少的数据点进行校准。已经表明,通过优化校正后的赤池信息准则 (AICc) 来确定带宽也可以优化偏差和方差之间的权衡(Yu 等人,2020 年)。因此,这种拟合优度标准是局部建模的理想选择,因为它会惩罚更复杂的模型而不是更简单的模型,并且它对于比较全局模型与局部模型的行为,或几个不同局部模型的行为,或由 MGWR 而不是 GWR 校准的模型。
(M)GWR 内的带宽具有可解释的现实意义,可以是基于距离的度量,也可以是每个局部回归中使用的最近邻居的数量。例如,对 100 个最近邻居的带宽的解释是,在位置 i 处被估计的过程以空间折扣方式受到其他相邻位置的影响,直到 i 的第 100 个最近邻居。所有其他位置的数据对 i 处的局部回归没有影响。如果以距离测量带宽,则 (M)GWR 校准中报告的带宽是数据点权重低于 0.05 时的距离,称为有效带宽。 4 图 1 描述了带宽对在 MGWR 的示例中应用于数据的权重应用于西雅图地区的房价数据,如下所述。此时,有 1255 个数据点,带宽被报告为每个局部回归中使用的最近邻居的数量。当带宽占位置总数的一小部分 (46) 时,权重会非常迅速地趋于零,因此只有非常接近回归点的数据才会对局部回归产生任何影响。当带宽占位置数量的很大一部分 (1250) 时,权重趋于零的速度要慢得多,因此模型趋向于全局回归,局部结果在空间上非常相似。
不管带宽参数是如何报告的,它都是一个点估计量并且具有不确定性,如果要比较带宽和声明在不同空间尺度上运行的过程,则需要测量不确定性。李等。 (2020) 演示了如何使用自举或 Akaike 权重(Burnham 和 Anderson,1998 年)来完成此操作,这两种方法都可用于提供带宽估计的置信区间。了解带宽不确定性可以提供有关不同过程运行的空间尺度的重要见解,尤其是在比较协变量特定带宽时。
3 局部模型对空间统计分析的影响
几个局部建模框架的发展现在已经相当成熟,对空间数据的统计建模产生了一些重要影响。
首先,也是最明显的一点是,全局模型在某些领域的应用必须受到质疑。正如上面关于局部化思维的评论所表明的那样,这些领域涵盖了人类行为的广泛范围,因为空间环境的影响仅在价值观、规范、偏好等方面才有意义,这些都是人类价值观。土壤、水体、原子和植被等没有经历过这种情绪,因此很难看出为什么局部模型适合分析此类实体的空间变化,除非它们可以说明正在校准的模型的一些错误指定问题。将局部模型应用于动物种群很有趣,并且可以对空间行为差异产生一些有效的解释,正如 Inman 等(2019) 所证明的那样。 以沙漠龟为例,它们在沙漠的不同地区似乎进化不同,因此具有不同的栖息地偏好。
(1)局部建模的潜力
将空间局部模型应用于广泛的人类行为在两个方面具有巨大的潜力。
- 首先,认为相同的刺激可能不会在不同地区引起相同的反应似乎是合理的。一个变量对另一个变量变化的敏感性,即使以其他协变量为条件,也可能随空间变化。通过局部变化的参数来实现这一点似乎是合理的。如果局部参数在空间上保持不变,那么这样做不会有任何损失,因为局部模型会退化为全局模型。允许参数随空间变化可以对创建我们观测到的数据的过程产生有价值的见解。从本质上讲,空间局部模型创建了一个全新的待研究地理学——过程中的空间变化。
- 其次,由于不考虑环境在人类行为中的作用,全局模型容易出现严重的错误指定偏差,从而导致全局参数估计可能产生误导。如果遗漏效应(上下文)对因变量有重大影响,并且上下文与全局模型中的一个或多个协变量强烈协变,则会发生这种情况。在局部模型中避免了此问题,因为局部截距考虑了上下文效应,允许更准确地测量其他协变量变化的影响。
(2)对空间回归模型的影响
在空间数据的统计建模中使用局部模型的进一步含义与空间回归模型的需要有关。
-
空间回归建模的存在理由是解决空间自相关误差项的问题,这是空间数据全局建模中经常遇到的问题。然而,有相当多的经验证据表明,当模型的空间局部版本被校准时,全局模型中报告的任何错误依赖性都会大大降低到统计无关紧要的程度(Zhang et al., 2005, 2009; Osborne et al. , 2007 年;Windle 等人,2010 年;Gao 和 Li,2011 年;Sá 等人,2011 年;Miller,2012 年)。不难理解为什么会发生这种情况——GWR 或 MGWR 中的局部截距与空间误差模型中的局部加权误差函数执行相同的功能。然而,局部模型有望优于空间误差模型,因为前者不仅包含上下文的影响,还允许被建模的关系在局部发生变化。
-
空间局部模型将注意力引向过程建模,特别是产生我们观测到的数据的看不见的过程可能随空间变化的可能性。过程可能随空间变化的概念对空间数据统计分析中经常遇到的长期存在的问题——可修改区域单位问题 (MAUP) 有影响。当相同的数据聚合到不同的分区系统时,就会出现 MAUP,然后当校准相同的模型时,这些不同的分区系统会产生明显不同的结果(Gehlke 和 Biehl,1934 年;Openshaw,1983 年;Fotheringham 和 Wong,1991 年;Cressie,1996 年) .在大多数以前关于 MAUP 的研究中,该问题被视为数据问题——也就是说,将数据聚合到区域中会改变数据的某些统计特性,这反过来会影响用聚合数据校准的模型的结果(Gehlke和 Biehl,1934 年;Arbia,1989 年;Amrhein,1995 年;Dark 和 Bram,2007 年)。但是,空间局部模型使我们能够将此问题视为与流程相关而不是与数据相关。也就是说,我们在个体层面观测到的数据来自可能随空间变化的该规模的过程。因此,这些数据的不同聚合将导致聚合级别上的不同过程组合,这将产生不同的模型校准结果。如果过程在空间上稳定,则结果对 MAUP 的敏感性会更温和;随着过程在空间上变得越来越不稳定,MAUP 对回归结果的影响将加强。因此,如果分析的规模发生变化并且正在检查的过程在空间上发生变化,则可以预期在相同基础空间数据的不同聚合上校准全局回归模型的结果会发生变化。这种对结果不一致的预期对于我们理解人类行为空间建模的可重复性也至关重要,因为真正可复制的研究可能无法实现。
MAUP 的更极端版本是辛普森悖论,其中关系符号随规模变化,因此全局和空间局部模型的结果可能相反(Simpson,1951 年;Blyth,1972 年;Alin,2010 年)。该悖论通常在空间环境中报告,但在比较同一模型的全局和局部校准结果时也可能发生。例如,可以报告条件关系的显著正全局参数估计值,但同一条件关系的一组显著负局部参数估计值。这种情况如图 2 所示,其中上图显示了全局情况,下图显示了在空间上分解为四个区域的相同数据。不太引人注目但更常见的情况是,全局参数不显著,但同一参数的许多甚至大部分局部估计值都显著,反之亦然。那么问题是:我们相信哪一组结果?同样,问题与分析的规模有关,事实上这两个结果都可能是正确的。在一个空间尺度上,这种关系可能是负面的,而在另一个空间尺度上,它可能是正面的:在不同尺度上进行的分析回答了不同的问题。例如,考虑入室盗窃。在单个住房单元的层面上,住宅被盗窃的概率与住宅空置的概率之间可能存在反条件关系——为什么要盗窃空房子?而在社区层面,入室盗窃率和空置住宅之间可能存在正条件关系——社区中较少的房屋有人居住,以阻止入室盗窃。
辛普森悖论的一个空间实例可以在真实经验数据的分析中观测到,如此处的一个简短示例所示。使用 Sachdeva 等人的房价数据集。 (2022) 横跨西雅图住房区和华盛顿州金县部分地区,我们根据 1255 个人口普查区块的聚合数据校准了以下对数-对数享乐模型。 (1255 个单位)
ln 房价中值 = β0 + β1(ln 平方英尺面积中值)+ β2(ln 失业率)+ + β3(ln 技术工作百分比)+ β4(ln 视图指数)+ β5(ln 到海滨的距离)+ β6 (ln 年龄中位数) (4)
其中视图指数表示距水体距离和海拔高度的组合,与距滨水区的距离相对不相关。使用最近邻的自适应双平方核用于使用 MGWR 2.2 软件校准 MGWR 模型。5 该模型中的最大可能带宽是清理数据差异后金县的块组总数,即 1255。和因变量都是标准化的,因此带宽和局部参数对于数据规模具有可比性和不变性。全局回归模型的 R2 值为 0.76,MGWR 模型的 R2 值为 0.91。下面的表 1 给出了全局回归模型的摘要以及自变量的全局参数估计值。
这些全局结果在很大程度上并无例外,并且符合房价决定因素的大多数发现。房价受到面积和高科技工作比例高的地区的积极影响,而受到高失业率地区、看不到水的地区以及远离海岸或其他地区的负面影响水体。然而,街区组中住房单元年龄中值的参数估计值显著且为正 (0.013),这表明在控制住房单元的其他结构和邻里特征后,房屋较旧地区的房价中值往往更高.整个地区似乎都偏爱较旧的住房,这是值得怀疑的,因为许多研究报告说,在其他条件不变的情况下,人们偏爱较新的住房,需要更仔细地研究(Sirmans 等人,2006 年)。
这是通过校准方程式中的模型来完成的。 (3) 由 MGWR,如上所述,它产生关于被建模的关系是否在空间上是非平稳的信息。在年龄与房价的条件关系的情况下,如图 3 所示,局部参数估计值在很大程度上是微不足道的。这种关系唯一重要的局部估计值是在该县的南部,并且这些都是正的,表明偏好较新的住房,其他条件不变。尽管对全局和局部享乐价格模型的结果的解释似乎相互矛盾,但它们在回答不同的问题。这种显著的积极全局关系可能反映了整个地区对更稳定和完善的社区的偏好,这些社区通常包含较旧的住房。在空间局部模型校准中发现的大部分地区的微不足道的关系表明,在社区内,房屋的年龄相对不变,因此在反映当地价格差异方面影响不大。当地显著的负相关关系表明,在这些社区内,人们更喜欢新建住房,其中可能有很多住房相对较新,因此年龄可以作为区分新房和旧房的指标。
(3)局部模型的诊断
尽管局部统计模型似乎为研究与人类行为相关的过程提供了巨大的潜力,但在接受局部模型校准的结果之前,空间分析师需要检查并在必要时纠正任何明显的错误指定问题,例如使用不正确的函数形式或省略信息协变量。例如,如上所示,由 MGWR 或贝叶斯 SVC 等模型产生的局部参数估计通常被映射和解释以表示空间变化的行为。然而,在某些情况下,关系可能是非线性的并且模型中使用的协变量随空间变化,在局部估计中观测到的空间变化可能仅仅是由于模型形式的错误指定而与空间非平稳行为无关。
因此,在根据人类行为解释这种变化之前,有必要进行诊断检查以检查局部参数估计值中观测到的任何空间变化是否可能是由于在模型中使用了不适当的函数形式造成的。 Sachdeva 等人。 (2021) 提供这样的诊断,以帮助区分关系是线性和非固定的场景与非线性和固定的关系。
(4)局部模型的校准
同样,由于在模型校准中遗漏了重要变量,可能会出现由于指定错误引起的问题。这些在空间局部建模框架的上下文下研究相对不足,需要进一步开展工作来识别和检查遗漏变量对模型解释和校准诊断的影响。然而,这导致了一个难题,即当遗漏变量具有与局部截距估计确定的上下文效应相似的空间分布时,如何区分什么是上下文效应和什么是遗漏偏差问题。例如,在图 4 中,再次从上述房价分析中得出,我们展示了两张估计局部截距的地图。左边是一张地图,显示当变量(到滨水区的距离)被故意从方程式中的模型中省略时截距的局部估计。 (3) 和右边是变量包含在模型中时的等效项。从行为角度解释左边的地图显然会导致就不同地点的内在价值得出一些不正确的结论,尤其是西雅图北部和萨马米什湖周围。右侧的地图(包括到海滨的距离)表明,金县不同地区被视为理想居住地的方式存在内在差异。西雅图周围的几个社区被认为是非常理想的,甚至考虑了模型中的各种因素,而金县南部的大部分地区被认为是相对不受欢迎的,即使考虑了模型中的各种因素。当然,可以说右手图中结果所基于的模型仍然是错误指定的,问题是“我们什么时候接受模型是正确指定的,以便我们可以将剩余的变化归因于局部拦截对上下文的估计?
空间局部模型的校准通常在计算上要求很高,并且在可以分析的数据量和完成校准所需的时间方面可能受到限制。在内存和时间效率方面比较 SVC、SFLR 和 GWR 模型的研究发现 GWR 在两个方面都优于 SVC 和 SFLR(Waller 等人,2007 年;Wheeler 和 Calder,2007 年;Wheeler 和 Waller,2009 年;Finley, 2011 年;Oshan 和 Fotheringham,2018 年)。然而,由于估计协变量特定带宽的复杂性增加,这些模型的多尺度版本往往对计算要求更高。虽然与 MSVC 相比,MGWR 在时间效率方面做得更好(Wolf 等人,2018 年),但尚未对所有多尺度模型进行比较。由于空间数据变得越来越普遍且分辨率越来越高,中型到大型数据集(多达一百万个数据点)的密集内存占用和高运行时间可能会阻碍局部建模技术的广泛使用。最近使用消息传递接口 (MPI) 对 MGWR 软件进行了计算改进,这使得它可以应用于数百万次观测,并且比早期版本快数千倍(Li 等人,2019 年;Li 和 Fotheringham,2020 年) .局部建模技术的这种进步对其广泛使用至关重要。
(5)样本外预测
虽然局部模型更常用于推断响应变量和预测变量之间的空间变化关联,但它们也可用于样本外预测。克里金法 (Matheron, 1963, 1969) 可以说是最流行的样本外预测方法,因为它具有最佳的线性无偏预测 (BLUP) 统计特性,但它是一种数据驱动的方法。局部建模预测方法是过程驱动的,因为首先在要预测数据的位置估计空间变化的过程,然后使用这些估计来预测响应变量。将局部建模技术与用于预测目的的克里金法进行比较的研究发现,这两种技术的混合是最佳的(Harris 等人,2010 年;Mohammadinia 等人,2019 年;Yang 等人,2019 年)。一项将 GWR 与广义线性模型、支持向量机和人工神经网络进行比较的研究发现,模型之间的预测精度相似,而 GWR 在效率方面优于其他模型(Mohammadinia 等人,2019 年)。随着空间局部模型的多尺度扩展在过程估计中优于其单尺度版本,有可能将此类模型应用于预测目的并评估其准确性。
(6)其他空间统计分析的局部化
最后,GWR 和 MGWR 中使用的数据借用概念可以扩展到其他形式的空间统计分析。文献中有 GW 主成分分析 (Harris et al., 2011)、GW 判别分析 (Brunsdon et al., 2007)、GW 汇总统计 (Brunsdon et al., 2002) 和 GW spatial交互模型(Kordi 和 Fotheringham,2016 年)。在每个应用程序中,概念都是相同的——而不是获得一组本质上是空间平均的结果,为什么不通过从附近位置借用数据并根据距离在 0 和 1 之间加权这些来获得每个位置特定的结果他们远离分析的焦点?当然,如果无法以某种方式优化加权函数,则结果的用处将有限。
4.局部模型对社会的影响
越来越多地使用空间局部模型来理解人类行为并认识到其价值,对于优化干预措施以创造更美好的社会具有深远的意义。目前,大多数用于理解社会行为决定因素的模型都是全球性的,并假设“一刀切”(Fotheringham 和 Sachdeva,2021 年;Sachdeva 等人,2022 年)。如果被建模的过程表现出空间非平稳性,则全局模型将被错误指定并可能产生高度错误的结果,最终导致不正确的干预来解决问题。
回到与天气数据的类比,并使用美国的平均温度作为全国热应力的预测指标,这将严重低估西南沙漠地区的问题,同时高估该国部分地区的问题,例如作为新英格兰。 Geddes 等 (2021) 的工作就是行为建模中的一个例子。他们研究了苏格兰部分地区结肠直肠癌筛查率决定因素的全局和空间局部模型,并展示了全局模型如何不能很好地代表大多数地方的癌症筛查率决定因素。同样,Sachdeva 等 (2021) 表明,全局房价决定因素模型无法提供有关西雅图大都市区不同地区房价决定因素的信息。本文还强调了环境或地点识别在影响房价方面的作用的重要性。 Fotheringham 等 (2021) 证明了上下文效应在投票行为中的重要性,并表明在影响人们投票给总统候选人的政党方面,它仅次于种族。上下文效应的空间模式与我们对选民本质上是共和党和民主党的国家部分的直觉相符。不考虑这种影响会导致某些参数估计出现严重的错误指定偏差。
现在存在大量空间局部模型的实证应用。不幸的是,其中许多要么没有以令人信服的全局模型开始,要么没有对结果进行稳健的推断检验,或者两者兼而有之。然而,有足够数量的论文确实提供了强有力的证据,表明在影响人类行为的许多过程中存在空间非平稳性。这对最近关于社会科学中可复制性的辩论具有重要意义,在这些辩论中,通常很难在不同的应用程序中得出一致的发现。也就是说,当同一模型在不同位置校准时,在一个位置校准模型的结果通常不成立——通常参数估计值有很大不同。这导致人们对许多基于经验的社会科学研究的稳健性缺乏信心。然而,空间局部模型的出现以及人们日益认识到 “上下文” 会对人类行为的决定因素产生重大影响,这表明当这些校准基于来自不同位置的数据时,我们不应期望模型校准会产生类似的结果。同样,它建议不应将在一个位置使用数据校准的模型应用于另一个位置;应进行新的校准。显然,这在某些情况下既费时又费钱,但替代方法是应用带有参数估计值的模型,这可能会产生极具误导性的结果。
5.总结和未来方向
在过去的二十年中,基于不同统计框架但基于相同原理并基本上产生相同输出的空间局部模型已在空间统计文献中得到公认。从某种意义上说,在某些应用领域使用局部模型是因为这些模型为传统的全局模型提供了重要的扩展,但在没有明显的空间过程非平稳性时默认为全局模型。如果应用得当,空间局部模型会产生一个新的可供探索的(过程或关系)地理环境,而不是对现实世界的测量。但是,使用空间局部模型有三个注意事项:
(1) 看起来局部模型的应用应该限于人类行为的建模方面,在这些方面我们可能期望基于位置的上下文效应会影响到模型的因变量,以及协变量与因变量交互的方式多变。前者通过局部截距测量,后者通过特定位置的斜率参数测量。
(2) 在局部模型的应用中,必须从一个强大的全局行为模型开始,在此模型中已经检查了各种诊断,以确保该模型的局部形式不会过度拟合数据或局部参数估计的变化不是由错误指定引起的;
(3) 在宣布局部参数估计的空间变化之前,必须使用适当的推断检验。
尽管在过去二十年中局部空间建模取得了巨大进步,但该领域仍在快速发展,目前的研究重点是推广和扩展空间加权函数、扩展可以局部化的模型范围和扩展带宽的概念,以便不仅产生特定于协变量的带宽,还产生特定于位置、特定于协变量的带宽。后者是局部空间模型发展过程中的自然演变,因为如果我们认识到过程可能随空间变化,那么这种变化本身是否可能在空间上不恒定?过程可能会在不同位置的不同空间尺度上发生变化,在某些区域相对恒定但在其他区域变化?此外,(M)GWR 框架内的主要加权函数是空间性的,其依据是空间中距离较近的数据点是由比位置较远的数据更相似的过程生成的。然而,其他类型的依赖关系可能存在,例如在时间维度中,并且扩展局部建模框架以包括其他类型的加权函数可能是有用的。例如,暂时扩展 GWR 框架已被证明可以提供更多信息(Fotheringham 等人,2015 年;Huang 等人,2010 年)。此外,Harris 等 (2013) 提出了一种上下文加权方案,该方案基于模型中使用的协变量的相似性以及空间邻近性对观测值进行加权。最后,过程(尤其是那些与社会科学有关的过程)也可以预期不仅依赖于空间,还依赖于互联网上形成的社交网络,这可能会类似地影响人类行为。因此,有可能开发空间局部模型,允许在过程依赖性和空间权重方面包含这些细微差别,并提出新的统计和计算挑战。
总的来说,在过去的二十年里,空间过程的感知和建模方式发生了某种革命,这为空间过程非平稳性的本质开辟了新的研究思路。这种调查来自不同的方向,并导致制定了不同类型的空间局部模型。无论形成这些模型的统计框架如何,目标都是相同的:允许并研究条件关系中的空间变化,这些变化提供了空间变化过程的证据。然而,还有很多工作要做,特别是关于空间过程非平稳性的存在和原因。