CAR 和 SAR 模型及其隐含的空间结构
【摘 要】 对空间参考数据中出现的空间相互作用进行建模通常是通过自回归模型将空间依赖性显式或隐式地纳入协方差结构来完成的。对于面元数据,两种常见的自回归模型是 条件自回归模型 (CAR) 和 **同步自回归模型 (SAR)**。这两种模型都会在协方差结构中通过邻居矩阵 $\mathbf{W}$ 的函数产生空间依赖性,并且通常是 一个固定但未知的空间相关参数。本文详细研究了这些模型应用于不规则面元数据时隐含的关联结构,尝试证明它们的许多违反直觉或不切实际的结果。数据示例用于说明,其中使用不同的空间模型对美国全州平均 SAT 语言分数进行建模和检查空间结构。
【原 文】 Wall, M.M. (2004) ‘A close look at the spatial structure implied by the CAR and SAR models’, Journal of Statistical Planning and Inference, 121(2), pp. 311–324. Available at: https://doi.org/10/d2pjx8.
1 简介
在许多设置中,观测到地理定义面元的平均值或计数,并进行回归分析。当地理面元位置已知时,通常假设彼此靠近的面元的观测,可能倾向于在回归中的发射变量上具有相似的分数,从而导致误差项在空间上自相关。因此,在模型中通常包含一些潜在的空间过程。除了改进回归系数的推断外,空间过程模型还应该能够提供残差空间模式的清晰图景,从而深入了解可能存在哪些发射变量。本文研究了对不规则面元(例如美国各州形成的面元)上的基础空间过程使用不同模型所隐含的不同空间结构。
有两种根本不同的方法来模拟格元数据(Lattice)下的空间结构。它们都是一般空间过程 ${Z(s): s \in D}$ 的特例,其区别在于对索引集 $D$ 的假设。一种方法将格元数据视为在连续索引集(即地统计数据,Cressie,1993)而另一种则是将其视为离散索引集(面元数据)。当采用前一种建模方法时,常假定每个格元内的数据已在该面元中心或质心处被观测到,通常将质心之间的距离用于开发空间协方差结构(如通过变异函数或协方差函数)。这种技术最常被提及的问题之一是将整个面元的汇总信息分配给质心的随意性。以这种方式对网格元数据进行建模的另一个概念性问题是:被建模的观测结果(即面元均值)实际上在模型允许的情况下不可能发生在连续平面上。但另一方面,以这种方式建模的好处是可以直接对空间协方差函数建模,因此结构通常很容易理解。
对格元数据下的空间结构建模的另一种方法(也本文详细研究的方法),并没有忽略格元数据的离散索引性质。这中模型通过基于面元的形状定义邻接结构来实现。因此,不是测量面元质心之间的距离,而是使用一种系统,该系统根据例如它们的边界是否接触来将面元定义为邻居。一旦定义了这个邻接结构,就可以考虑时间序列中类似于自回归模型的模型。两种非常流行的包含这种离散邻居信息的模型被称为 同步自回归模型
和 条件自回归模型
,即 SAR 和 CAR 模型。 SAR 和 CAR 模型最初是作为无限规则网格上的模型开发的,其中 SAR 始于 Whittle (1954) 和 CAR 模型始于 Besag (1974) 。当用于对无限规则网格建模时,这些模型非常类似于定义在整数上的广为人知的平稳自回归时间序列模型。也就是说,CAR 在其马尔可夫性质上是类似的,而 SAR 在其函数形式上是类似的(Cressie 1993,第 6.3、6.4 节)。
但当这些模型应用于不规则网格时,邻接结构和空间相关参数对隐含协方差结构的影响还没有得到很好的理解,也没有得到明确的检验。
对于有限的规则网格,有几位作者曾经指出,SAR 和 CAR 模型隐含的协方差结构在每个测点会产生非恒定方差,并且在相隔相同数量邻居的面元之间会产生不相等的协方差,参见如 Haining (1990), Besag 和 Kooperberg (1995)。
在本文中,我们对这些模型的隐含结构进行了更详细的描述,特别是研究了它们在不规则面元上的结构。
第 2 节
定义了 SAR 和 CAR 模型并讨论了其标准使用。第 3 节
介绍了美国不规则面元的空间回归示例,其中使用 SAR 、 CAR 、指数变异函数和独立同分布模型比较了空间结构。该示例演示了这些模型获得的预测差异以及使用 SAR 或 CAR 模型时出现的一阶邻居之间的相关性差异。第 4 节
着眼于美国面元的 SAR 和 CAR 相关结构,通常作为 “空间依赖” 参数的函数。第 5 节
是结论和讨论。
2 SAR 和 CAR 模型
设 ${Z(A_i): A_i \in (A_1 \ldots A_n)}$ 是一个高斯随机过程,其中 ${A_1 \ldots A_n}$ 形成了 $D$ 的一个网格。如果 ${A_1 \ldots A_n}$ 是 $D$ 的一个简单划分,即 $A_1 \cup A_2 \cup \ldots \cup A_n = D$ 且对于所有 $i \neq j$ 都有 $A_i \cap A_j = 0$ ,则我们称面元 ${A_1 \ldots A_n}$ 形成了 $D$ 的一个网格。
对此过程建模的一种方法是使用 同步自回归模型 (SAR)
$$
Z(A_i)= \mu_i + \sum^{n}{j=1} b{ij} (Z(A_j) − \mu_j) + \varepsilon_i \tag{1}
$$
其中 $\boldsymbol{\varepsilon} = (\varepsilon_1, \ldots, \varepsilon_n)’ \sim \mathcal{N}(\mathbf{0}; \boldsymbol{\Lambda})$,而 $\boldsymbol{\Lambda}$ 为对角矩阵,$\mathbb{E}(Z(A_i)) = \mu_i$, 和 $b_{ij}$ 是已知或未知常数,且 $b_{ii} =0;i=1,\ldots,n$。这个模型被称为同步的,因为通常误差项 $\varepsilon_i$ 与 ${Z(A_j): j \neq i}$ 相关。如果 $n$ 是有限的,我们可以将 $\mathbf{B} = (b_{ij})$ 视为包含 $b_{ij}$ 的矩阵。 $\mathbf{Z} =(Z(A_1),Z(A_2),\ldots ,Z(A_n))’$ 的联合分布是:
$$
\mathbf{Z} \sim \mathcal{N} (\boldsymbol{\mu}, (\mathbf{I}_n − \mathbf{B})^{-1} \boldsymbol{\Lambda} (\mathbf{I}_n − \mathbf{B})^{-1’}) \tag{2}
$$
其中 $\boldsymbol{\mu} =( \mu_1, \mu_2,\ldots, \mu_n)$ 并且 $\mathbf{I}_n$ 是 $n$ 维单位矩阵。
另一种建模 ${Z(A_i): A_i \in (A_1 \ldots A_n)}$ 的方法是使用 条件自回归模型 (CAR):
$$
Z(A_i)|Z(A_{(-i)}) \sim \mathcal{N} \left( \mu_i + \sum^{n}{j=1} c{ij} (Z(A_j) − \mu_j), \tau_i^2 \right ) \tag{3}
$$
其中 $Z(A_{(-i)}) = { Z(A_j): j \neq i }$,$\mathbb{E}(Z(A_i)) = \mu_i$,$\tau_i^2$ 是条件方差,$c_{ij}$ 是已知或未知的常数,特别是 $c_{ii} = 0; i=1 \ldots n$。如果 $n$ 是有限的,可以形成矩阵 $\mathbf{C} =(c_{ij})$ 和 $\mathbf{T} = \operatorname{diag}{ \tau^2_1, \tau^2_2, \dots ,\tau^2_n}$,并且根据因式分解定理(参见如 Besag,1974)有:
$$
\mathbf{Z} \sim \mathcal{N}(\boldsymbol{\mu}, (\mathbf{I}_n − \mathbf{C})^{-1} \mathbf{T} ) \tag{4}
$$
上述两种模型中, $\mathbf{B}$ 和 $\mathbf{C}$ 的结构通常主要由空间网格的形状来定义。一种构造 $\mathbf{B}$ 或 $\mathbf{C}$ 的常见方法是:使用单个参数来缩放用户自定义的邻接矩阵 $\mathbf{W}$,该矩阵指示了面元是否为邻居。
$\mathbf{W}$ 的一种常见定义方法是令 $\mathbf{W} =(w_{ij})$ 为:
$$
w_{ij} =
\begin{cases}
1 & \text{如果} \quad A_i \quad \text{与} \quad A_j \text{共享公共边(或边界)}\
0 & \text{如果} \quad i = j\
0 & \text{其他}
\end{cases}
$$
因此,对于 SAR 模型来说, $\mathbf{B} = \rho_s \mathbf{W}$,而对于 CAR 模型来说,$\mathbf{C} = \rho_c \mathbf{W}$。其中 $\rho_s$ 和 $\rho_c$ 通常被称为 “空间相关性参数或空间依赖性参数”,会留待根据数据进行估计。
还有其他方法被用于定义邻居结构 $\mathbf{W}$ ,例如限制 $\mathbf{W}$ 的行总和为 $1$ 或将权重作为边长的精细函数来创建。
Clayton 和 Bernardinelli (1992) 指出,在邻居数量存在变化的情况下(大多数不规则格存在这种情况),上面用 $0$ 和 $1$ 定义 $\mathbf{W}$ 的方式在内部会产生不一致。因此,推荐了一种加权方案 $\mathbf{W} =(w^*_{ij})$。其中 $w^*_{ij} = w_{ij} / w_{i+}$ 以便使条件均值称为平均计算,而不是简单的求和计算(注: $w_{i+}$ 指行 $i$ 的元素值之和 )。
需要注意的是:对于 CAR 模型来说,$\mathbf{W}$ 和 $\mathbf{T}$ 需要满足对称条件,即 $w_{ij} \tau_j^2 =w_{ji} \tau_i^2$。因此,如果使用了新的 $\mathbf{W} =(w^*_{ij} )$,则其条件方差 $\tau_i$ 也应该正比于 $1/w_{i+}$。
以上述方式指定的 “单参数 $\times$ 权重矩阵” 的 SAR 和 CAR 模型,已经在文献中广泛被用于对不规则格建模(在计量经济学领域中,有如 Anselin 和 Florax (1995) 以及 Kelejian 和 Prucha (1999);在疾病制图领域中,有如 Clayton 和 Kaldor (1987)、Mollie 和 Richardson (1991)、Bell 和 Broemeling (2000) 以及 Stern 和 Cressie (2000),并被纳入一些软件中:例如 S-Plus Spatial Stat 和 BUGS)。
Besag 等 (1991) 引入了本征条件自回归模型 (ICAR)(将 Kunsch (1987) 的术语扩展到了不规则域),该模型在疾病制图和图像恢复文献中也很流行。该模型可被视为 CAR 的一种极限情况,会产生 $\mathbf{Z}$ 的不适当联合分布。 ICAR 过程并不存在相关性,因此在本文中不予考虑。ICAR 已在其他地方得到广泛研究,例如参见 Yasui 等 (2000) 及其参考文献。
3 一个例子
3.1 数据概况
为了使用这些模型提供此类生态空间回归的示例,我们考虑了与 1999 年 SAT 大学入学考试相关的州级汇总数据。这些数据记录自 9 月 1 日星期三在明尼阿波利斯明星论坛报上发表的一篇文章, 1999 年,大学委员会作为其来源。这些数据包括全州 SAT 平均语文分数以及特定州符合条件的学生参加考试的百分比。图 1
显示了语言分数的直方图和语言分数的散点图(按合格学生参加考试的百分比)。图 2
显示了各州分数的等值线图(按四分位数)。该地图表明中西部各州的 SAT 语文平均分更高,散点图清楚地表明平均语文分数与参加考试的学生百分比之间存在强烈的反比关系。
图 1. 左图:1999 年 48 个连续州平均 SAT 语文分数的直方图,右图:各州平均 SAT 语文分数与实际参加考试的合格学生百分比的散点图
图 2. 1999 年 48 个连续州平均 SAT 语言分数的等值线图。
令 $Z(A_i)$ 代表 $A_i$ 州的平均 SAT 语文分数,$X(A_i)$ 代表在 $A_i$ 州实际参加考试的合格学生的百分比,$i=1\ldots 48$。我们考虑模型
$$
Z(A_i)= \beta_0 + \beta_1 X(A_i) + \beta_2 (X(A_i))^2 + u(A_i) \tag{5}
$$
其中假设 $\mathbf{u} =(u(A_1),u(A_2),\ldots ,u(A_{48})’$ 服从均值为零的正态分布。
3.2 考察的模型
我们考虑 $\mathbf{u}$ 的四种不同协方差结构。
SAR 模型 和 CAR 模型。我们首先考虑 SAR 和 CAR 中使用的 $\mathbf{W} =(w^*_{ij})=(w_{ij}/w_{i+})$ 邻接结构,将所有相互邻接的州间关系定义为非零。
附录 A
中给出了 US 网格邻接结构的定义。对于 CAR 模型,我们取 $\mathbf{T} = 2 \sigma_c \operatorname{diag}(1/w_{i+})$,对于 SAR 模型,我们取 $\boldsymbol{\Lambda} = \sigma^2_s \operatorname{diag}(1/w_{i+})$。$\mathbf{T}$ 没有采用常数定义对于 CAR 来说是必要的,用于满足对称条件;但在 SAR 模型中选择了类似的 $\boldsymbol{\Lambda}$,只是为了比较,没有必要。指数型变异函数模型。我们然后考虑了一个各向同性的指数型变异函数结构 $\mathbf{u}$,其中每个州的质心被用于计算州之间的距离 $|d_{ij}|$ ,协方差由 $\operatorname{Cov}(u(A_i),u(A_j)) = \sigma^2 {g1} + \sigma^2{ g2} ∗ \exp(−|d_{ij}|/\text{range})$ 来定义。
独立同分布模型。我们最后考虑了 $\mathbf{u}$ 的独立同分布结构,其中 $\operatorname{Var}(\mathbf{u})= \sigma^2 \mathbf{I}_{48}$。结果如
表 1
所示。
3.3 推断情况
从 表 1
可以看出,估计得出的 $\beta_0$; $\beta_1$ 和 $\beta_2$ 在所有四种情况下都相似,其 $95%$ 置信区间都会重叠。请注意:
正如预期的那样,独立同分布模型产生最小的标准误差,因为它假设有 $48$ 个独立观测值。使用 Moran’s I,我们检验了独立同分布模型的残差中存在空间结构,发现了一个指示空间相关性(如果只是简单地拟合大尺度趋势可能会错失)的显著 p 值。
SAR 和 CAR 模型分别产生了 $\rho_s =0.60$ 和 $\rho_c =0.83$ 的空间参数。
指数型变异函数产生了的变程参数值为 $490$ 英里。
不同模型中的方差参数不能直接比较,但可以得出一些结论。回想 CAR 和 SAR 模型的 $\mathbf{T} = \sigma^2_c \operatorname{diag}(1/w_{i+})$ 和 $\boldsymbol{\Lambda} = \sigma^2_s \operatorname{diag}(1/w_{i+})$ 并注意到各州的平均邻居数约为 $4.45$。 所以粗略地估算,$\mathbf{T}$ 或 $\boldsymbol{\Lambda}$ 的平均方差分别为 $\sigma^2_c/4.45=91.80$ 或 $\sigma^2_s / 4.45=91.96$。用于表示指数协方差模型中非空间随机误差的块金效应 $\sigma^2_{g1}$,远小于在 CAR 和 SAR 模型中的类似方差 $\mathbf{T}$ 和 $\boldsymbol{\Lambda}$,这意味着指数方差模型将比 CAR 或 SAR 更接近数据。
最后,我们给出了每个模型的对数似然值,但请注意,应谨慎比较这些值。没有一个模型嵌套在任何其他模型中。注意这里拟合的 独立同分布模型并没有嵌套在 SAR 和 CAR 模型中,因为 独立同分布模型假定常数方差 $\sigma^2 \mathbf{I}$,甚至当 $\rho_s = 0$ 或 $\rho_c = 0$ 时,由于 $\boldsymbol{\Lambda} $ 和 $\mathbf{T}$ 的定义,SAR 和 CAR 模型仍然具有非恒定方差。
现在我们关注小尺度空间结构的预测,即 $\mathbf{u}$ 在 SAR、CAR 和指数变异函数模型下的预测值。
由于参加考试的学生百分比的影响,我们想检查在去除大规模趋势后剩余的空间结构。我们首先发现 CAR 和 SAR 模型为 $\mathbf{u}$ 给出了非常相似的预测值,它们之间的相关性为 $0.998$,但 CAR 预测比 SAR 预测具有更大的可变性(左上图,图 4)。使用指数变异函数的 $\mathbf{u}$ 预测值不同,并且与 SAR 和 CAR 值的相关性为 $0.612$。在 图 3
的顶部,我们展示了使用 SAR 和指数变异函数预测的小尺度空间结构的等值线图(CAR 未显示,因为它与 SAR 几乎相同)。
分级颜色在零处有意义地分开,因为零表示预测的语言分数恰好由大型模型 $\beta_0 + \beta_1 X(A_i) + \beta_2(X(A_i))^2$ 给出的值。大于零的值意味着小尺度空间结构模型预测的州平均值高于单独由大尺度模型预测的州平均值,反之亦然。
SAR 模型产生比指数变异函数 “更平滑” 的图像,这可能是它在实践中流行的部分原因。但是 SAR 模型对空间相关性有何看法?图 3
中左下方的图显示了 SAR 模型隐含的所有一阶邻域相关性的直方图。密苏里州和田纳西州之间的相关性最小,为 $0.24$,缅因州和新罕布什尔州之间的相关性最大,为 $0.64$。对于这些极端情况,我们注意到缅因州是唯一一个只有一个邻居的州(即新罕布什尔州),而田纳西州和密苏里州是仅有的两个拥有八个邻居(最多邻居)的州,并且它们是彼此的邻居。因此,隐含的相关性似乎与每个面元的邻居数量有关。相反,图 4
左下方的图表明这种关系并不简单。我们进一步强调了 表 2
中的观点,表明田纳西州和密苏里州的八个不同的一阶邻居中的每一个都有八个不同的相关性。 SAR 模型中邻接矩阵的结构表明,田纳西州与阿拉巴马州的相关性高于与密西西比州的相关性,密苏里州与堪萨斯州相比与爱荷华州更相似。这合理吗?由于 SAR(或 CAR)协方差模型没有系统的结构,因此没有很好的方法来检验它是否是描述数据空间结构的合理模型。另一方面,对于指数变异函数(因为我们可以完整而简洁地描述隐含的协方差结构),我们至少有一种方法可以通过经验变异函数检验拟合的模型来检查其到残差空间结构是否合理,图 3
的右下角。
4 $\rho_s$ 和 $\rho_c$ 之间的关系和隐含的空间相关性
在本节中,我们检查 SAR 和 CAR 模型的相关结构作为它们的 “空间依赖” 参数 $\rho_s$ 和 $\rho_c$ 的函数。请注意,当 SAR 和 CAR 的协方差矩阵 $(\mathbf{I}n − \rho_s \mathbf{W} )^{-1} (\mathbf{I}n − \rho_s \mathbf{W} )^{-1’}$ 和 $(\mathbf{I}n − \rho_c \mathbf{W})^{-1} \mathbf{T}$ 只是 $\mathbf{W}$ 和 $\rho_s$ 或 $\rho_c$ 的函数( 其中 $\boldsymbol{\Lambda} = \sigma^2_s \operatorname{diag}(1/w{i+})$ 和 $\mathbf{T} = \sigma^2_c \operatorname{diag}( 1/w{i+})$ 被标准化为相关矩阵)。为了便于演示,我们考虑美国面元邻接矩阵 $\mathbf{W} =(w^*{ij})$ 并关注模型相关性与 $\rho_s$ 和 $\rho_c$ 的真实参数值之间的函数。
$\rho_s$ 和 $\rho_c$ 的参数空间的通常被约束为 ${ \rho_s: \rho_s \omega_i <1}$ 和 ${ \rho_c: \rho_c \omega_i< 1 }$(参见,例如 Haining 1990,p. 82)。其中 $\omega_i$ 表示 $\mathbf{W}$ 的第 $i$ 个特征值。
对于协方差为 $(\mathbf{I}_n − \rho_c \mathbf{W})^{-1} \mathbf{T}$ 的 CAR 模型,对 $\rho_c$ 的约束是保证正定性的必要条件。而对于 SAR 模型,$\rho_s$ 的条件太强(Kelejian 和 Robinson,1995),实际只需要 $(\mathbf{I}_n − \rho_s \mathbf{W})$ 非奇异即可。这可以通过强制 $\rho_s =1/\omega_i$ 来满足。这个更广泛的参数空间是否有任何用处是值得怀疑的,因为当它超出通常考虑的面元 ${ \rho_s: \rho_s \omega_i < 1}$ 时,$\rho_s$ 的解释变得极其困难或不可能。基于美国网格 $\mathbf{W}$ 的特征值,$\rho_c$ 和 $\rho_s$ 的参数空间被限制为 $(-1.392, 1)$。(上限 $1$ 是约束 $\mathbf{W}$ 的行之和为 $1$ 的结果)。
在这里,我们考虑基于这两个模型的所有一阶邻居之间的隐含相关性如何随 $\rho_s$ 或 $\rho_c$ 变化。
在美国网格上,有 $107$ 对州被视为一阶相邻州,即它们的边界接触。图 5
显示了这些邻居之间隐含的相关性作为 $\rho_s$ 和 $\rho_c$ 的函数。我们立即在 图 5
中看到,对于任何给定的 $\rho_s$ 或 $\rho_c$,所有一阶邻居之间的相关性都存在差异。相关性的这种可变性随 $\rho_s$ 和 $\rho_c$ 变化,例如,当 $\rho_s =0.1$ 时,相关性变程从 $0.03$ 到 $0.19$,而当 $\rho_s =0.6$ 时相关性变程从 $0.24$ 到 $0.64$,相关性变程要大得多。从图 5
中也可以清楚地看出,与 SAR 模型中的 $\rho_s$ 相比,CAR 模型中的一阶邻域相关性作为 $\rho_c$ 的函数增加速度更慢。关于 图 5
的一些事情在直觉上令人愉悦。随着 “空间相关性” 参数($\rho_s$ 或 $\rho_c$)从零增加到参数空间的上限,所有站点之间的隐含相关性单调增加。这符合我们对时间序列自回归模型的直觉:随着自回归参数从零开始增加,时间之间的相关性增加。另一个是当 “空间相关” 参数($\rho_s$ 或 $\rho_c$)到达参数空间的端点时,所有位点对之间的隐含相关性趋向于 $1$ 或 $-1$。 (因为 $\rho_s$ 和 $\rho_c$ 到达了区间的下沿 $-1.392$,所以很难在 图 5
中看出,但所有相关性确实接近于 $1$ 或 $-1$)。
我们现在指出可能是这些模型中最令人不快的结果。也就是说,随着 $\rho_s$ 和 $\rho_c$ 的变化,隐含相关性从大到小的排序并不一致。换言之,图 5
中存在相互交叉的线。例如,当 $\rho_c =0.49$ 时,$\operatorname{Corr}(Alabama; Florida) = 0.20$ 而 $\operatorname{ Corr}(Alabama; Georgia) = 0.16$。但是,当 $\rho_c =0.975$ 时,阿拉巴马州和佐治亚州之间的相关性大于阿拉巴马州和佛罗里达州之间的相关性,即 $\operatorname{ Corr}(Alabama; Florida) = 0.65$ 而 $\operatorname{ Corr}(Alabama; Georgia) = 0.67$。因此,当我们意识到它们之间的关系可以根据 “空间相关性” 参数而改变时,已经难以解释的相关性变得更加难以理解。
当 $\rho_s$ 或 $\rho_c$ 为负时,在 图 5
中可以看到进一步的非直觉行为。一些一阶邻居之间的隐含相关性可能是正的,但这取决于正在考虑的 $\rho_s$ 或 $\rho_c$ 的值。当 $\rho_s$ 或 $\rho_c$ 略微为负时,这些特定的一阶邻域相关性为负,但随着 $\rho_s$ 或 $\rho_c$ 变得更负,隐含的相关性变为正。例如,当 $\rho_s = −0.716$ 时,$\operatorname{ Corr}(Maryland; Penn:)=−0.18$ 和 $\operatorname{ Corr}(Vermont; Mass)=−0.15$ 但当 $\rho=−1.32$ 时,$\operatorname{ Corr}(Maryland; Penn: )=0.085$ 和 $\operatorname{ Corr}(Vermont; Mass) = 0.94$。在 US 网格中的 $107$ 个一阶邻居对中,当 $\rho_s$ 或 $\rho_c$ 为负时,有 $34$ 个最终具有正相关。请注意,对于 SAR 和 CAR 模型,这些对是相同的。目前尚不清楚是什么将这些网站对与其他网站区分开来。我们尝试寻找这些州对的相邻模式之间的相似性,但一无所获。例如,它们并不都具有偶数个或奇数个邻居,并且它们不位于图中的任何特定面元。
5 总结
已经证明,使用 SAR 和 CAR 模型的不同州之间隐含的空间相关性似乎并不遵循直观或实用的方案。例如,一般来说,研究人员似乎没有任何理由想要建立一个坚持密苏里州和田纳西州是陆地上空间相关性最低的州的空间模型。为什么密苏里州与堪萨斯州的关联度要高于与爱荷华州的关联度?这就是具有 $\mathbf{W} =(w^*_{ij})$ 邻接矩阵的 SAR 和 CAR 模型所暗示的。还需要注意的是,当权重矩阵被简单地取为 $0$,$1$ 矩阵时,会出现类似的非直观空间结构,即 $\mathbf{W} =(w_{ij})$。
Cressie (1993) 将 (2) 和 (4) 中的 $\mathbf{B}$ 和 $\mathbf{C}$ 称为模型中的 “空间依赖矩阵” ,Ord (1975) 称这些矩阵的第 $(i; j)$ 个元素 “表示位置 $j$ 对位置 $i$ 的可能交互程度” 。这些描述具有误导性,因为它们似乎暗示可以直接检查 $\mathbf{B}$ 和 $\mathbf{C}$ 的结构以了解为 ${Z(A_i): i =1\ldots n}$ 建模的空间相关性。事实并非如此,因为实际上解释空间结构的分别是 $(\mathbf{I}_n − \mathbf{B})^{-1}$ 和 $(\mathbf{I}_n − \mathbf{C})^{-1}$ 的逆。正如我们在本文中看到的那样,尽管这些协方差显然只是 $\mathbf{B}$ 或 $\mathbf{C}$ 的函数,但通常它们与由此产生的空间相关性之间没有明显的直观联系。
从这个讨论来看,似乎应该考虑其他直接模拟协方差结构的网格元数据建模方法,例如地质统计模型,特别是当有兴趣理解空间结构时。为了减轻 CAR 模型隐含的不良特性,Besag 和 Kooperberg (1995) 考虑了一种方法,该方法是 “标准地统计学和高斯马尔可夫随机场公式的部分综合” 。
尽管它们很受欢迎,但这些 SAR 和 CAR 模型已经拟合一遍又一遍,但没有过多强调试图破译它们的含义。这可能是由于这样一个事实,即通常对包含它们的分析的主要兴趣是确定回归中的重要预测变量,而不是理解空间结构本身。但是,如果有任何机会确定 SAR 或 CAR 模型是否为数据提供良好的拟合,那么首先了解 SAR 和 CAR 模型似乎是明智的。本文的重点是透明化并指出这些模型将网格的地理结构纳入空间协方差结构的方式可能存在的问题。希望这些问题的澄清可能会导致他们的解决方案取得进展。