空间滤波方法
【摘要】 本文关注的重点是特征向量空间滤波方法(Eigenvectors Spatial Filtering, 特征向量空间滤波)。这是一种方法已广泛应用于地理学、区域科学、城市研究、经济学、生态学和流行病学等诸多领域的局部空间异质性建模方法。与地理加权回归方法探求回归系数背后的空间模式不同,空间滤波方法旨在检测空间数据中残差的空间模式。本文将介绍特征向量空间滤波方法的基础理论和扩展方法,并且讨论应用此方法时需要考虑和避免的问题。
【原文】 Y. Yamagata and H. Seya, Eds., Chapter 6, Spatial analysis using big data: methods and urban applications. London, United Kingdom ; San Diego, CA: Academic Press, an imprint of Elsevier, 2020.
1 简介
本文关注的重点是空间变系数模型的发展,尤其是其中的特征向量空间滤波方法(Eigenvectors Spatial Filtering, 特征向量空间滤波)(Griffith, 2003 年)。 这种方法已广泛应用于地理学、区域科学、城市研究、经济学、生态学和流行病学等诸多领域。 特征向量空间滤波方法旨在检测含噪声空间数据中残差背后隐藏的空间模式,这与地理加权回归方法探求回归系数背后的空间模式存在显著不同。本文的目的是介绍特征向量空间滤波方法的基础理论和扩展性方法,并且讨论应用此方法时需要考虑和避免的问题。
2 空间滤波方法的类型
空间滤波方法从字面上理解,是应用空间滤波器来捕获数据背后的空间依赖性。流行的方法主要包括(本文重点介绍前者):
- 特征向量空间滤波方法 :使用
Moran I
统计量构建空间滤波器。 - Getis 方法(参见 Getis 和 Griffith,2002 年):使用 Getis G 统计量压缩过滤器
简单理解,空间滤波是一种使用某种空间滤波器(模式变量)对空间依赖性进行建模的方法。通常这些模式变量可以根据诊断统计数据进行解释。特征向量空间滤波具有简单性和可扩展性的优点,并且与高斯过程密切相关(见 第 6 节
)。
3 莫兰系数与莫兰特征向量
全局与局部莫兰指数(系数)
(1)全局莫兰系数
在全局相关性分析中,最常用的统计量就是 Global Moran’I (全局莫兰指数),它用于描述在整个区域上所有空间单元与邻域单元之间的 平均相关程度。计算公式如下:
其中, 为总权重, 为第 和第 个空间单元间的空间权重值, 为空间单元总个数, 和 分别表示第 个空间单元和第 个空间单元的属性值(如房产价格、GDP 总量等,严格来说,全局莫兰指数是在判断某个属性的空间相关性), 为所有空间单元属性值的均值。
依据公式,莫兰指数 的取值范围为 ,有着明确的空间相关性含义。
值范围 | 含义 |
---|---|
所有地区的属性值在空间上有正相关性,即属性值越大(小)越容易聚集在一起 | |
表示地区的属性值随机分布,无空间相关性 | |
所有地区的属性值在空间上有负相关性,即属性值越大(小)越不容易聚集在一起 |
那么为什么会有这样的空间相关性含义呢?
从整个计算过程可知,空间相关性主要体现在分子 中,其他项可以暂且简单地视为归一化项。 而该分子公式的实质就是: 空间单元的邻接权重指数 × 空间单元间属性值的偏差。前者对应着 各地区在空间上的位置关系,后者对应着 各地区属性值之间的差异,两者作乘积再求和,就得到了所有地区在整个空间上的相关性程度。
直观地理解,对于邻近点 ,只有当 和 同时 大于或者小于 均值 时(正相关),值越大,全局莫兰指数越趋近于 ;而当 和 偏离平均值 且方向相反时(负相关),偏离值越大时,全局莫兰指数越趋向于 。
(2)局部莫兰系数
- 参考 Griffiths, D. (2003) ‘Spatial autocorrelation and spatial filtering. Gaining understanding through theory and visualization’. Berlin: Springer-Verlag.
空间自相关指在空间上出于不同位置的同一变量值之间自身的相关性,严格归因于这些值在地理空间中的接近性。空间自相关在经典统计的独立观测假设之外,引入了偏差概念。相关性的一个常见情况是序列相关性,指根据某个数值序列(例如,时间序列)的单一变量观测值之间的相关性。同一变量的邻近或邻近地理参考值可以通过 二值地理连通性/权重矩阵来标识,例如 ;如果两个位置是邻居,则 ;如果不是,则 (参见 图 A.1
,其中如果两个区域单元共享一个公共的非零长度边,则它们被视为相邻)。因此,空间自相关可以用 Pearson 乘积矩相关系数公式表示,只不过用变量 的相邻接变量集合替换了单一变量 的值:
转变成:
上式就是著名的莫兰系数(Moran Coefficient,MC)公式,式中仅当矩阵 中存在 时才计算分子项,注意分子通过 做了归一化处理。很容易看出,该式的分母项是样本方差。
图 A.1: (a) 上图:密苏里州亚代尔县,一个说明正空间自相关的经验示例。 (b) 底部:弗吉尼亚州塞勒姆县,一个说明负空间自相关的经验示例。
与全局莫兰系数一样,局部莫兰系数的大小也具有同样的空间依赖指示意义。
- 正空间自相关意味着地理上邻近的变量值在地图上趋于相似:高值趋向于位于高值附近,中值趋于位于中值附近,而低值趋于位于低值附近(见
图 A.1a
)。大多数社会科学变量往往在空间上适度正相关,例如,人口密度和房价等人口统计和社会经济特征、社区通常是具有相似偏好的家庭群、家庭倾向于以一种将相似的家庭属性集中在地图上的方式来组织自己等。政府的政策和活动,如城市规划和分区,有时会强化这种模式。 - 具有负空间自相关的地理上邻近的变量值,在地图上往往不相似:高值往往位于低值附近,中值靠近中值,低值靠近高值。相应的地图是高度分散的。很少有社会科学变量显示负空间自相关,这使得
图 A.1b
中的负空间自相关案例更加有趣。例如,负空间自相关可能源于经济活动之间的空间竞争。
空间自相关可以用不同的方式解释,其中一种解释是代表了空间模式(格局),此时的空间自相关被视为趋势、梯度或地图上的马赛克。可以通过研究莫兰系数的矩阵形式来进一步理解空间模式,特别是与 式 (A.2)
中的分子求和对应的项 ,其中 是 单位矩阵, 是元素为 的 向量, 是矩阵转置, 是传统多元和回归分析中常见的、以向量 为中心的投影矩阵。矩阵 的特征决定了莫兰系数的取值范围;因此,局部莫兰系数不限于范围 。此外,该矩阵的 个特征值建立了与地图相关联的一组与众不同的莫兰系数值,与其相伴的 个特征向量则表示不同的、相互正交的空间自相关模式。因此,Griffith (2000a) 认为这些特征向量从不同空间模式描述了地理参考变量中的潜在空间自相关,而这一点正是空间滤波的基础:保留一部分感兴趣的空间模式,滤除其他不感兴趣的空间模式。
(3)莫兰散点图
(4)LISA 图
特征向量空间滤波建立在 Moran 系数 (MC)
矩阵基础之上,也被称为 邻接矩阵的主坐标
(Dray 等,2006)[2],在生态学中也被称为 Moran 特征向量图
。这是一种常用的空间依赖性诊断统计量。莫兰系数的向量形式为:
其中 是对角线为零的 对称连接矩阵,描述了不同空间单元之间的连通关系; 是全部元素为 的列向量。直观地看, 计算的是单元 和其邻居集合 之间的相关系数。 是多元统计回归中常见的中心投影矩阵,使 中心化。
显然,矩阵 的特点,决定了莫兰系数的取值范围。此外,值得注意的是,每个空间单元都会有一个莫兰系数,并且当存在正空间相关性(即 和 之间存在的正相关系数)时,莫兰系数取正值,当存在负相关性时莫兰系数取负值。 感兴趣的读者可以自行计算并可视化一幅莫兰系数图(LISA 图 或 Moran 散点图)。
对矩阵 进行特征分解,生成 ,其中 是特征向量构成的矩阵。 是一个以特征值 为对角元素的对角矩阵。
图 1
显示了特征向量所对应的空间图,显而易见,对应于较大特征值的特征向量描绘了正相关的空间模式,而那些对应于负特征值的特征向量描绘了负相关的模式。也就是说,不同特征向量本质上代表了相互正交的不同空间模式。 下面我们从数学上进一步阐述这种关系。
图 1: Moran 特征向量 (e1,e5,e20) 的两个例子。
为了看到这一点,让我们观察第 个特征向量的莫兰系数值:
式 (2)
表明:特征向量的莫兰系数值与其对应的特征值成正比。换句话说,特征向量提供了一种在隐空间中对空间依赖性进行描述的方法,不同特征向量对应于相互正交的某种空间模式,因为每个特征向量代表的空间依赖水平,都对应于一个独特的、与其特征值成比例的莫兰系数(Griffith,2003)。
具体来说,第一个特征向量 是具有最大正莫兰系数的数值集合,可以通过 定义的空间排列得到;第二个特征向量 是与 不相关且正交的、具有第二大正莫兰系数的值集;…;以此类推, 是与 不相关且正交的、具有最大负莫兰系数的数值集合。
4 特征向量空间滤波模型
根据上一节的分析, 矩阵的每一个特征向量,分别描述了一种独特的空间依赖模式,如果我们在模型中加入感兴趣的空间模式组分,则模型就具备了与空间有关的建模能力;进一步的,如果不同的空间单元的空间模式组分不同或不同空间模式的比例不同,我们就具备了空间变系数建模能力。这就是空间滤波的基本思想,由于仅选用了部分空间模式组分,相当于滤除掉了其他未选用的空间模式组分,因此被称为空间滤波。
(1)特征向量的可组合特性
特征值的线性组合仍然可以用莫兰系数来解释,这意味着多钟空间模式的组合。设 是一个包含了 中 个特征向量的矩阵, 是一个系数向量;则线性组合 的莫兰系数可以使用 式(2)
导出,如下所示:
通过简单地估计回归系数 ,我们可以对数据背后的空间相关过程 进行建模。而 特征向量空间滤波方法
正是利用这一性质,通过在模型中增加一个空间滤波项 ,来对解释变量背后的空间依赖性进行建模。由于模型只会选择其中 个特征向量参与建模,并不会使用所有特征向量,相当于滤除掉了未选用的空间模式,因此命名为空间过滤。
(2)特征向量空间滤波模型
一个基础的 特征向量空间滤波模型
可以被表述为:
其中 是空间无关项,而 是与空间有关的空间滤波项,是部分特征向量的线性组合。可以看出,该模型形式上与标准线性回归模型相同,只是增加了线性性质的空间滤波项,因此可以采用相同的求解方法。
中的 个特征向量可以选择如下:
步骤(1)
: 先验地去除代表无关紧要的空间依赖水平的特征向量;
步骤(2)
: 根据自定义的准则选择重要的特征向量。
除了地理学之外,特征向量空间滤波方法在区域科学和生态领域也特别受欢迎。
(3)一些领域的应用
- 区域科学领域
在区域科学中,特征向量空间滤波方法已被用于消除残差空间依赖性以恰当地估计回归系数及其标准差。 与空间计量经济学类似,通常将 假定为二值连通矩阵,尽管它不是行归一化的。 在 步骤 (1)
中,通常仅保留满足 的特征向量,以消除部分正空间相关性,确保模型的简约性。Griffith (2003) 和 Chun 等 (2016) 表明,该准则可以有效地消除残差中的空间依赖性,同时确保模型简约性。此外,从残差中消除正空间依赖性和负空间依赖性的另一个可用的准则是 (参见 Tiefelsdorf 和 Griffith,2007)。 在 步骤 (2)
中,通过最大化模型的准确度(例如,调整后的 值和 AIC 信息准则)或最小化残差莫兰系数值来选择重要的特征向量。 可以看出,式 (4)
与标准线性回归模型相同,因此可以使用基于 OLS 的迭代方法进行估计。
- 生态学中的应用
在生态学中,特征向量空间滤波方法通常用于识别生态过程背后的地图模式。与区域科学不同的是, 中通常会假设一个距离衰减函数来模拟空间依赖性,并且在 步骤(1)
中保留所有对应于正特征值的特征向量。这是因为具有相对较小特征值的特征向量,可以用于解释小尺度空间变化,对于恰当地估计潜在地图模式很重要(参见 Dray 等,2006 年)。
(4)考虑随机效应的空间滤波模型:RE-ESF
虽然特征向量空间滤波方法在概念上简单易懂,但经常由于忽视了空间过程的不确定性而受到批评。因为特征向量空间滤波方法只是拟合一个确定性函数 ,它无法区分出潜在空间过程和其他虚假信号(包括噪声)。换句话说,此方法会将噪声与空间信号混淆在一起。
此外,就像地统计学中的高斯过程 (GP) 模型一样,科学家需要考虑空间过程的不确定性问题,以便正确模拟数据背后的空间过程。 幸运的是,当 中的固定系数被替换为随机系数时,特征向量空间滤波模型可以被视为一个降秩后的高斯过程。这种新的指定方式也被称为 随机效应-特征向量空间滤波
(RE-ESF;Murakami 和 Griffith,2015 年),形式化为:
其中 表示空间过程的方差,而 是控制特征值衰减的参数。由此形成的空间滤波项导致 ,这是一个降秩和居中化后的高斯过程。如果 较大,则 值较大的特征向量系数被增强,并且产生具有大尺度空间模式的空间过程。如果 较小,则相反。因此,就像地理加权回归中的带宽参数一样, 估计了残差空间过程的尺度。 Murakami 和 Griffith(2015)通过模拟研究表明,式(5)
提高了系数的估计精度及其统计显著性。
在此模型指定中,数据不确定性/噪声和空间过程不确定性分别通过估计 和 来平衡;因此可以正确识别空间过程。此特性大大提高了一些经过扩展后的特征向量空间滤波模型的估计精度,包括如: 空间变系数模型
( Murakami 等人,2017 年)和 空间无条件分位数回归模型
(Murakmai 和 Seya,2019 年)等。
5 示例
本节对样本量为 的土地价格数据应用 标准线性回归模型(LM)
、特征向量空间滤波模型
和 随机效应-特征向量空间滤波模型
。因变量为(对数)住宅价格,解释变量为(对数)距最近火车站的距离( 变量名为 Station )、该站到东京站的(对数)铁路距离(变量名为 Tokyo )。根据 Dray 等 (2006) 的工作, 矩阵的第 个元素由 定义,其中 是连接样本点的最小生成树中的最大距离。
表 1:估计结果;
***
和**
分别代表 和 水平的统计显著性
估计结果汇总于 表 1
。表中数据表明:
- 标准线性回归模型(LM)中的 Tokyo 变量具有统计显著性,而 Station 变量则不显著,似乎有违直觉;另外,残差的莫兰系数值变得具有统计显著性,这意味着残差中存在着空间依赖性。由此,标准线性回归模型被认为是一种错误指定,估计结果不可靠。
- 在
特征向量空间滤波模型
和随机效应-特征向量空间滤波模型
中,残差的莫兰系数值在统计上都不显著。经验证,是因为它们能够有效过滤残差的空间依赖性。 随机效应--特征向量空间滤波模型
成功地识别出了残差的标准差( )和空间过程的标准差( )。换句话说,残差变化中的 可以由空间过程解释。随机效应-特征向量空间滤波模型
的系数估计表明 Tokyo 变量和 Station 变量是负显著的(即距离越大,价格越低,并且两者都是显著的),这与直觉是一致的。
6 快速特征向量空间滤波建模
6.1 大 N 问题
原始特征向量空间滤波模型有两个计算瓶颈:
- 特征分解
- 特征向量选择。
其中前者的计算复杂度是为 ,是优化的重点。在标准计算环境中,通常只有在 时,才能粗略地进行特征分解。
6.2 技术途径
(1)快速特征分解的方法
幸运的是,机器学习领域中已经提出了一些近似的特征分解方法。其中一种被称为 Nystrom 扩展
的流行方法可用于 Moran 特征向量的近似。
根据 Murakami 和 Griffith (2019) ,前 个近似特征值组合可以形式化为:
其中 是 个锚点间的空间连通矩阵的 矩阵。锚点由 k-mean 方法定义的聚簇的几何中心来定义。显然 越大近似效果越好,但计算速度越慢。 Murakami 和 Griffith (2019) 建议使用 来平衡精度和计算效率。
图 2
显示了从 矩阵中提取的第 、 和 个精确和近似特征向量的样例。该图表明,近似特征向量能够成功保留空间尺度信息。
图 2: 精确和近似的 Moran 特征向量 (, , )。
(2)级联特征分解方法
特征分解的另一种方法是 Griffith 和 Chun(2019)提出的级联方法。它将研究区域划分为小的子集并在每个子集中执行特征向量空间滤波模型。
(3)其他说明
基于 Nystrom 扩展的方法(一种低秩方法)与主成分分析一样,适用于近似大尺度空间结构,而基于子集的方法更适合捕捉小尺度空间变化。
(4)可用软件包
基于 Nystrom 扩展的近似模型可以在 spmoran
包中找到,该包中还有扩展后的各种空间回归模型(包括 空间变系数模型
)。空间变系数模型的公式为:
假设 ,则 ,其中 。 和 是确定第 个空间变系数的方差和尺度的参数。换句话说,Moran 特征向量用于模拟回归系数背后的空间变化。尽管随机系数 可以用固定系数代替,但固定效应模型往往会使系数失效(参见 Murakami 等,2019 年)。 Murakami 和 Griffith (2019) 还为空间变系数模型开发了一种计算效率高的受限似然估计方法。
参考文献
- [1] Chun, Y., Griffith, D.A., Lee, M., Sinha, P., 2016. Eigenvector selection with stepwise regression techniques to construct eigenvector spatial filters. Journal of Geographical Systems 18 (1), 67e85. da Silva, A.R.,
- [2] Dray, S., Legendre, P., Peres-Neto, P.R., 2006. Spatial modelling: a comprehensive framework for principal coordinate analysis of neighbour matrices (PCNM). Ecological Modelling 196 (3e4), 483e493.
- [3] Getis, A., 2008. A history of the concept of spatial autocorrelation: A geographer’s perspective. Geographical Analysis 40 (3), 297e309.
- [4] Getis, A., Griffith, D.A., 2002. Comparative spatial filtering in regression analysis. Geographical Analysis 34 (2), 130e140.
- [5] Griffith, D.A., 2003. Spatial Autocorrelation and Spatial Filtering: Gaining Understanding through Theory and Scientific Visualization. Springer Science & Business Media.
- [6] Griffith, D.A., Chun, Y., 2019. Implementing Moran eigenvector spatial filtering for massively large georeferenced datasets. International Journal of Geographical Information Science 1e15.
- [7] Murakami, D., Griffith, D.A., 2015. Random effects specifications in eigenvector spatial filtering: a simulation study. Journal of Geographical Systems 17 (4), 311e331.
- [8] Murakami, D., Griffith, D.A., 2019. Spatially varying coefficient modeling for large datasets: eliminating N from spatial regressions. Spatial Statistics 30, 39e64.
- [9] Murakami, D., Lu, B., Harris, P., Brunsdon, C., Charlton, M., Nakaya, T., Griffith, D.A., 2019. The importance of scale in spatially varying coefficient modeling. Annals of the Association of American Geographers 109 (1), 50e70.
- [10] Murakami, D., Seya, H., 2019. Spatially filtered unconditional quantile regression: application to a hedonic analysis. Environmetrics 30 (5), e2556.
- [11] Murakami, D., Yoshida, T., Seya, H., Griffith, D.A., Yamagata, Y., 2017. A Moran coefficient-based mixed effects approach to investigate spatially varying relationships. Spatial Statistics 19, 68e89.
- [12] Tiefelsdorf, M., Griffith, D.A., 2007. Semiparametric filtering of spatial autocorrelation: the eigenvector approach. Environment and Planning A:Economy and space 39 (5), 1193e1221.