【摘 要】 空间统计模型对于地理空间数据建模非常有效,因为它们考虑了地理空间和其他非空间协变量的空间信息,使它们能够通过解决空间依赖性来最小化空间自相关。相比之下,机器学习模型在预测非空间数据方面非常有效,但由于空间自相关问题,它们在建模和预测地理空间数据方面效果不佳。在用于地理空间数据建模的机器学习模型中,经常出现的局限性之一是没有将地理空间的空间信息融合到模型中的标准方法,因此机器学习模型中无法最小化空间自相关。

在本研究中,我们提出了一种局部空间信息嵌入的机器学习方法,该方法能够在预测地理空间现象的同时,通过解决空间依赖性来最小化空间自相关。

我们的研究应用 特征向量空间滤波方法 从空间坐标中提取近似特征向量,并将它们作为一组向量与选定的非空间协变量一起嵌入到机器学习模型中。我们比较了传统空间统计模型和基于机器学习的模型之间的相对预测性能。实验表明,在机器学习模型规范中结合空间过滤的特征向量来表示空间信息可显著提高预测性能。

【原 文】 M. D. Islam, B. Li, C. Lee, and X. Wang, “Incorporating spatial information in machine learning: The Moran eigenvector spatial filter approach,” Transactions in GIS, vol. 26, no. 2, pp. 902–922, Apr. 2022, doi: 10.1111/tgis.12894.

1 引言

空间统计和机器学习(ML) 模型可以提供有关地理空间现象的影响因素的宝贵信息以及对未来情景的洞察。通常,统计模型更适合生成推理统计,而机器学习模型主要用于预测/分类目的。对于地理空间数据分析,空间统计模型因其对传统统计模型预测的准确估计而越来越受欢迎 (Griffith,[2003];Murakami & Griffith,[2015])。在构建地理空间数据模型时,空间统计回归考虑了 Tobler 地理学第一定律的影响:“一切都与其他事物相关,但近处的事物比远处的事物更相关” (Tobler,[1970])。由于地理空间数据的空间依赖性,空间现象受邻域特征的影响很大。空间依赖性描述了一种情况,即在特定位置的观察往往表现出与邻近位置相似的值 (LeSage,[2008] )。某些非空间数据 (例如,房价或 Airbnb 租金)由于其空间依赖性而在中央商务区 (CBD) 区域显示较高值的空间聚簇 (Gyódi 和 Nawaro,[2021] )。最早的空间统计模型无法解决空间数据的空间依赖性;因此,在残差中可以观察到空间自相关现象 (Cliff & Ord,[1969],[1973] )。空间统计模型通过应用 地理加权回归特征向量空间过滤 等多种方法来解决空间数据的空间依赖性,从而克服了传统统计模型的局限性;因此,它们的性能比传统回归模型更准确和令人满意 (Anselin,[2010];Brunsdon,Fotheringham, & Charlton,[1998];Goodchild,[2004];Griffith,[2003],[2020]; Murakami & Griffith, [2015];Tobler,[1970])。

尽管机器学习模型因其在预测非空间数据方面的性能而倍受推崇,但它们无法解决空间自相关问题,因为它们缺乏捕获地理空间数据的空间相关性的能力。通过纯数据驱动的机器学习算法训练空间数据集的结果往往是一个 “无法检测空间模式” 和 “无法最小化空间自相关问题” 的模型。但忽视空间模式和自相关问题会导致模型产生误导性的、糟糕的结果。

因此, 本研究提出了一种基于特征向量空间滤波 (ESF) 的机器学习方法来预测地理空间现象,其中空间过滤特征向量的作用是通过应用地图模式变量来捕获空间依赖性。特征向量是从数据点的空间位置获得的,在机器学习模型定义中表示为空间信息的代理变量( proxy variable )。我们的假设是: 这些选定的特征向量如果作为空间信息的代理变量,会使机器学习模型能够解决空间依赖性并最小化空间自相关

我们使用华盛顿金县的房屋销售价格数据集作为实验数据集来测试所提出方法的性能。

2 研究现状

GIS 和统计模型现在为研究人员提供了一种能够识别和监测空间现象的宝贵工具。 GIS 数据对于分析地理空间问题至关重要,因为一些问题与地理位置相关,并且在许多学科中具有更广泛的应用,甚至超出了数据科学或空间统计。此类数据还可以捕获时间变化,这可能有助于我们了解时空趋势。

统计和机器学习模型与 GIS 相结合使我们能够模拟未来场景,这些场景提供有关时空趋势的有用信息和对特定空间现象潜在问题的洞悉 (Montero、Mínguez 和 Fernández-Avilés,[2017];Wu,[2017])。然而,一些模型由于其复杂的错误处理技术而获得比其他模型更高的预测准确性。因此,仔细选择合适的预测模型对于分析和预测空间数据至关重要。

长期以来,空间统计模型一直是空间数据建模和预测的主要方法。局部空间模型可以表现空间数据的空间依赖性质,因此在空间数据建模和预测方面非常成功。早期的空间统计模型是以基于共享回归模型及其变体的形式引入的 (Ahasan,[2019a]; Can, [1992]; Chen, Ong, Zheng, & Hsu, [2017];Goodman,[1978];Janssen、Söderberg 和 Zhou,[2001])。通常,共享回归是在多元线性回归框架内进行的,并且经常因其严格的假设而受到批评 (Ahasan,[2019a], [2019b])。该模型可用于生成推断统计数据,但与更灵活的机器学习模型 (Limsombunc、Gan 和 Lee,[2004] ) 相比,其预测性能非常差。最近推出的基于随机效应的特征向量空间滤波(RE-ESF) 模型,似乎在解决空间自相关问题方面比其他空间回归模型提供了有希望的结果 (Griffith,[2020]; Murakami & Griffith, [2015]; Wang, Kockelman and Wang [2013]。空间过滤的特征向量与协变量相互作用可以在对地理空间数据建模时消解许多空间关系。

相比之下,机器学习模型,例如支持向量机 (SVM; Chen et al., [2017]; Wu, [2017])、人工神经网络 (ANNs; Lim, Wang, Wang, & Chang, [2016])、随机森林 (RF;Akay、Topal、Kizilarslan 和 Bulbul,[2019])、决策树 (Park & Bae,[2015]) 等,被用于空间数据建模,并在预测中提供了有希望的结果。然而,这些研究仅限于结合距离衰减变量,通过距离衰减和非空间协变量之间的相互作用来在一定程度上解决空间自相关 (Ahasan,[2019a];Chen 等,[2017])。这种方法的缺点是有时数据不可用或人为错误可能导致在创建和处理距离衰减变量时排除一些表示数据空间结构的协变量。因此,机器学习模型无法解决因缺少协变量而导致的空间自相关问题,因此性能可能会下降。

此外,处理和研究这些空间变量也是一项费时费力的工作。研究这么多距离衰减变量以确定哪个变量可以解决空间自相关是不可行的。为了克服这些限制,我们提出了一种面向空间数据建模的、基于 ESF 的机器学习方法,该方法将从地理空间坐标中生成选定的特征向量,并在模型定义中将其表示为空间信息的代理变量,而不是距离衰减变量。本研究假设特征向量空间滤波方法(原先主要用于回归分析以解决空间自相关问题)能够使机器学习模型解决相同的问题。

在选择机器学习模型时,我们专注于更灵活的算法,例如 XGBoost、支持向量回归器 (SVR) 和 人工神经网络 ANN,因为与其他机器学习算法相比,它们具有复杂的错误处理能力。

  • XGBoost 在数据建模方面的表现优于任何其他机器学习算法,并已成功应用于众多领域 (Georganos 等,[2018]; Islam, Islam, Ahasan, Mia, & Haque, [2021]; Li, Cao, Li , Zhao, & Sun, [2020]; Oh, Ham, Lee, & Kim, [2019])。在多项研究中,它显示出比其他算法 (包括 SVM、RF 和 ANN) 更好的性能和更少的时间 (Georganos 等,[2018]; Munkhdalai, Wang, Park, & Ryu, [2019])。因此,本研究将探索该算法与其他空间统计模型一起用于空间数据建模的有效性。
  • 相比之下,SVR 在类之间有明显的分离边缘时也表现良好,并且在高维空间中更有效。因此,本研究假设数据库中额外选择的特征向量将提高 SVR 模型的性能,从而使模型能够解决空间自相关问题。
  • 除了这两个机器学习模型外,本研究还探讨了 ANN 模型,该模型非常流行并广泛用于建模和预测空间和非空间数据 (Zhang, Di, Lin, & Guo, [2019] ) 。

最后,本研究以基于特征向量空间滤波的空间统计模型作为基准,对基于特征向量空间滤波的机器学习模型的相对预测性能进行了比较。

3 材料和方法

3.1 研究区域和数据预处理

本研究使用华盛顿州金县的开源房屋销售数据集(图 [1]),可在 Kaggle 网站上获取(Harlfoxem,[2016])。该数据集包含 2014 年 5 月至 2015 年 5 月共有 21,61321,613 条记录,具有 2020 个单独的住房特征。

Figure01

图 1: 数据点(房屋)在华盛顿 King County 的位置

少数数据点位于县城偏远地区,距离中心城区和郊区太远。这些数据点会严重影响特征向量空间滤波的空间地图模式,并在空间统计模型中产生噪声。因此,从数据集中删除了 136136 个数据点以使分析更简单。剩余数据点总数为 21,47721,477,平均售价为 54,06254,062。有关住房数据集属性,请参见 表 [1]

表 1: King County 的房价数据库属性列表

Variable Description
id Identification
price Sale price
bedrooms Number of bedrooms
bathrooms Number of bathrooms
sqft_liv Size of living area in square feet
sqft_lot Size of the lot in square feet
floors Number of floors
waterfront 1 if the property has a waterfront, 0 if not
view How good the view of the property is, ranked 0 to 4
condition Condition of the house, ranked 1 to 5
grade Classification by construction quality
sqft_above Square feet above the ground
sqft_basmt Square feet of basement
yr_built Year built
yr_renov Year renovated
zipcode 5-digit zip code
lat Latitude
long Longitude
sqft_liv15 Size of living space in 2015 (square feet)
sqft_lot15 Size of the lot in 2015 (square feet)

销售价格的频率密度图显示它是右偏的(图[2a])。偏态响应变量可能会产生偏态残差,因为异常值仍保留在残差中。回归分析的假设之一是残差正态性,在这种情况下会被违反。因此,已执行对数转换以减少响应变量的偏斜。变换后变量的频率密度直方图显示响应变量呈正态分布(图[2b])。

Figure02

图 2: 房屋销售价格分布情况:(a)未经转换; (b) 对数转换后

转换后的销售价格地图显示,金县的房屋销售价格分布存在地域差异(图[3])。地图中心(即华盛顿湖周围)的一组较高值很明显,表明华盛顿湖周围的房价高于其他位置。

Figure03

图 3: 对数变换后的房屋销售价格空间分布

局部莫兰散点图和聚类图(图 [4])。在 999999 个随机排列和 p=0.05p = 0.05 显示整个地理空间的高-高和低-低聚类。 Moran’s I =0.632= 0.632 表明研究区房价分布存在空间自相关。

Figure04

图 4: (a) Moran 的销售价格散点图和 (b) 聚类图

为了简化分析和模型解释,我们通过处理原始变量创建了几个变量。例如,我们没有使用 yr_built,而是通过从销售年份中减去 yr_built 创建了一个名为 building_age 的变量。我们将 yr_renov 转换为分类变量 (age_renov),其中 11 表示建筑物至少翻新过一次,00 表示建筑物根本没有翻新过。纬度和经度变量被排除在分析之外,因为一些机器学习算法需要数据归一化,例如 ANN(Nayak、Misra 和 Behera,[2014]),并且归一化地理坐标会使其变得毫无意义。相反,我们将地理坐标转换为平面坐标 [投影坐标系:NAD 1983 (2011) State Plane Washington North FIPS 4601] 并使用它们来提取空间特征向量。由于担心区域单元的变更问题,邮政编码变量被排除在分析之外(Gehlke & Biehl, [1934]; Openshaw, [1984])。

3.2 变量选择

选择重要变量构成的子集是模型构建过程中不可或缺的一部分,因为大多数模型不会处理大量不相关的变量,这可能会在模型中引入噪声并最终可能导致模型过拟合。

本研究使用顺序替换法,也称为逐步选择法,去除不太重要的变量并找到用于建模的最佳变量组合(Miller,[1984])。顺序替换法是向前和向后选择的结合,最初从没有预测变量开始,然后顺序添加有影响的预测变量。接下来删除不会改善模型拟合的剩余变量。最后,只有选定的变量用于进一步分析,以确保模型之间的公平比较。

3.3 随机效应特征值空间过滤

特征向量空间滤波主要用于通过展示空间在不同空间尺度下的空间排列来理解地理空间中的空间现象(Griffith,[2003],[2020];Griffith & Chun,[2013];Griffith,Chun,& Li , [2019])。 Jong, Sprenger, and Veen ([1984])。 揭示了极端非零特征值与其关联的极端 Moran’s I 和 Geary’s C 之间的关系,它估计空间自相关的强度。然而,来自 Tiefelsdorf 和 Boots ([1995]) 的发现。后来导致了 Moran’s I 和特征值之间联系的概念,并开创了基于拓扑特征向量的空间过滤概念 (Griffith, [1996])。空间过滤方法生成的综合解释变量代表了数据集的空间结构,可以通过与非空间协变量的交互来解决空间依赖性问题(Wang et al., [2013])。在各种空间过滤技术中,基于特征向量的空间过滤似乎在空间数据建模时提供了有希望的结果(Griffith,[2000])。正如 Griffith 和 Chun ([2013]) 所述,特征向量空间滤波使用数学分解,其结果称为双中心空间权重矩阵的特征函数。

详细信息参见 《空间滤波方法》

3.4 XGBoost

XGBoost 是树回归器的集合,被引入以有效减少计算时间并扩展树提升算法(Chen 和 Guestrin,2016 年)。它主要用于监督学习,其中训练数据 xij\mathbf{x_{ij}} 用于分类/预测目标变量 yi\mathbf{y_i}。将每棵树的预测分数相加得到最终分数,并通过 NN 个加性函数评估预测输出。

详细信息参见 《深入理解XGBoost(知乎)》

3.5 Support vector regressor

原文此处只是支持向量回归的简介,没有价值,暂略。

3.6 Artificial neural networks

原文此处只是支持人工神经网络,没有价值,暂略。

3.7 基于特征向量空间滤波的 XGBoost、SVR 和 ANN

本研究应用特征向量空间滤波方法从空间坐标中提取近似特征向量,并将它们作为一组向量与选定的非空间协变量一起嵌入到机器学习模型中。

实施方法:使用 R 编程语言的 “spmoran” 包提取特征向量 (EV)(Murakami,[2017])。使用 “XGBoost” 包来实现 XGBoost 算法,并使用 “Caret” 包来实现 kk 折交叉验证方法来验证每个模型。在交叉验证期间,我们应用网格搜索方法优化每个算法的参数,并在最终模型中使用优化后的参数(XGBoost:eta = 0.3,max_depth = 3,nrounds = 150,colsample_bytree = 0.6;SVR:C = 3,kernel = rbf;ANN:size = 5,decay = 1e-01)。使用多种机器学习算法的目的是确保基于特征向量空间滤波的机器学习为方法在基准模型 RE-ESF 上的性能可靠性。

3.8 评估指标

本研究应用了几种传统的回归指标来进行模型验证。

  • (1)R2 衡量预测值和实际值之间的拟合优度。
  • (2)均方误差 (MSE) 测量预测值和观测值之间的平方差的平均值。
  • (3)均方根误差 (RMSE) 是 MSE 的平方根,它衡量残差的标准差。
  • (4)平均绝对误差 (MAE) 衡量观察值和预测值之间误差差异的平均值,而不考虑它们的方向。
  • (5)全局莫兰 I 检验,测量残差中空间自相关的强度。它检测残差的空间聚类,能够揭示特定模型捕获空间依赖性的能力。

4 ANALYSIS AND RESULTS

表 2 显示了初始线性回归结果,不包括任何位置/空间变量。预测变量可以解释 log_price65.2%65.2\% 的变化,而所有变量都很显著的,gradewaterfront 是两个最有影响力的预测变量,系数分别为 0.2120.2120.3850.385。但是一些变量,例如 sqft_lotsqft_abovesqft_lot15,估计值非常小甚至为零。 sqft_livsqft_above 的方差膨胀因子 (VIF) 得分均大于 55,表明变量之间存在多重共线性。相关变量必须从数据集中删除,因为它们严重影响空间统计模型。但是我们在删除这些变量时应该非常小心,因为我们可能会错误地删除一个重要的变量。因此,除了相关矩阵 ( 图 [7a] ) 同时删除一个变量。图 [7a] 显示 sqft_livsqft_above 高度相关。因此,它们都需要从数据集中删除。但两者都与 log_price 高度相关。 R2 图 (图 [7b])。 显示 sqft_livlog_price 的相关性强于 sqft_above。因此,从数据集中删除了 sqft_above 变量。 sqft_liv15 变量也与 sqft_livgrade 适度相关,但与 log_price 的相关性不如其他两个变量强。同样,sqft_lot15sqft_lot 中度相关,但它们与 log_price 的关联相似。在删除上面的强相关变量 sqft_above 之后,我们运行逐步回归以从数据集中选择最具影响力的变量子集。确定了八个最具影响力的变量,导致低贝叶斯信息准则 (BIC)、Cp 和残差平方和 (RSS) 值以及逐步回归分析中调高后的 R2 值 (图 [8])。 。

表 2: 线性回归结果

Predictor log_price
Estimate CI [confidence interval]
(Intercept) 10.335626
bedrooms −0.0163770
bathrooms 0.0545398
sqft_liv 0.0001983
sqft_lot 0.0000002
floors 0.1198739
waterfront 0.3850934
view 0.0386654
condition 0.0444042
grade 0.2115720
sqft_above −0.0000866
building_age 0.0054347
age_renov[1] 0.0363239
sqft_liv15 0.0001090
sqft_lot15 −0.0000006
Obs. 21,477
R2/R2 adj. 0.652/0.651

Figure07

图 7: (a) 皮尔逊相关系数矩阵; (b) 预测变量之间的 R2 矩阵和响应变量

Figure08

图 8: (a) RSS; (b) 调整后的 R2R^2; © BIC ;和 (d) 逐步回归的 CpC_p

我们再次实施了另一个线性回归模型,仅从逐步回归分析中选择了八个变量,发现所有变量都显著,并且 VIF 分数是可以接受的 (表 [3] 。这八个变量可以解释响应变量中 64.5%64.5\% 的变异,而其他七个变量仅对 R2 的增加贡献了 0.7%0.7\%,可以忽略不计。

表 3: 具有子集变量的线性回归结果

Predictor log_price
Estimate CI [confidence interval]
(Intercept) 10.4629
bathrooms 0.0603
sqft_liv 0.0001
floors 0.0889
waterfront 0.3802
view 0.049
grade 0.2104
building_age 0.0059
sqft_liv15 0.0001
Obs. 21,477
R2/R2 adj. 0.6448/0.6447

去除那些无关紧要的变量后,可以注意到系数的微小变化,而滨水区和坡度仍然是八个变量中影响最大的。因此,只有这八个变量被用于进一步分析,以便在空间统计和机器学习模型之间进行公平比较。

k-fold (k = 10) 交叉验证 (CV) 方法用于验证和比较统计模型和机器学习模型之间的性能。表 [4] 显示,仅使用八个非空间变量,XGBoost 就可以达到 68.72%68.72\% R2。此外,RMSE 为 0.29480.2948,可以优于 SVR 和 ANN 模型。统计回归模型达到 64%64\%R2,RMSE 为 0.31420.3142,表明机器学习模型 XGBoost 和 SVR 在预测方面优于统计回归模型。

表 4. 仅使用非空间变量的 10 折交叉验证结果

Model RMSE MSE MAE R 2
LR 0.3142 0.0988 0.2511 0.6444
XGBoost 0.2948 0.0869 0.2333 0.6872
SVR 0.2998 0.0899 0.2334 0.6772
ANN 0.3128 0.0978 0.2490 0.6490

表 [5] 显示了在融合了近似空间特征向量( EV )时所有四个模型的预测性能结果作为局部空间信息。此外,还使用了修改后的 LR 模型 (RE-ESF),其中特征向量被添加为协变量。该表表明,与初始对应的非空间模型相比,添加空间特征向量可以显著提高所有机器学习模型的预测性能。 XGBoost 和 SVR 模型的_R_2均为 89%89\% ,RSME 为 0.1740.174;这些最初大约是 68%68\%0.290.29。与 XGBoost 和 SVR 模型相比,ANN 模型的性能并不令人满意。令人惊讶的是,空间统计回归模型 RE-ESF (即修改后的 LR 模型) 在初始非空间模型上表现得非常好,并且达到了与 XGBoost 和 SVR 模型几乎相似的预测精度。图 [9] 可视化了具有和不具有空间变量的所有四种模型的准确性评估指标。这些图表描述了在初始点上添加空间信息后模型的性能提高了多少。 可以说,嵌入特征向量的机器学习模型比初始的非空间模型具有更高的准确性,这是本研究的主要目标。与此同时,已经建立的空间统计模型 RE-ESF 也达到了几乎相似的预测精度。因此,我们可以总结,以空间特征向量的形式结合空间信息可以提高空间统计和机器学习模型的性能。

表 5: 非空间变量和 EV 的 10 折交叉验证结果

Model RMSE MSE MAE R 2
RE-ESF 0.1764 0.0311 0.1304 0.8854
XGBoost 0.1745 0.0305 0.1269 0.8901
SVR 0.1744 0.0304 0.1256 0.8910
ANN 0.2693 0.0725 0.2015 0.8428

Figure09

图 9: (a) RMSE; (b) MSE; © MAE; and (d) R2 plots of all four models showing their improvement after incorporating spatial EVs

虽然 XGBoost 和 SVR 模型的性能相似,但我们选择 XGBoost 模型只是为了可视化在机器学习模型规范中加入空间特征向量的效果。 LR 和 XGBoost 模型的残差分布图显示没有空间信息的空间聚类残差 (图 [10])。 。残差较高并与 Elliott 和 Poverty Bay 以及重工业综合区周围聚集在一起 (见图 [1] ). LR 和 XGBoost 模型残差中的 Moran’s I 检验分数分别为 0.5329 和 0.4161,表明残差中存在显著的空间自相关。

Figure10

图 10: 残差分布和残差的全局 Moran’s_I_检验结果

将空间特征向量添加到模型后,RE-ESF 和基于特征向量空间滤波的 XGBoost 模型残差中的 Moran’s I 得分分别降至 0.0729 和 0.0484,表明统计模型和机器学习模型残差中的空间自相关性显著降低.此外,两个模型的残差分布图都显示空间聚类的去除表明残差的空间随机性。结果再次证实,将空间过滤的 EV (主要用于空间统计回归以解决空间依赖性) 纳入机器学习模型,使它们能够最大限度地减少空间自相关并提高预测性能。

变量重要性图 (图 [11])。 显示 XGBoost 模型将等级和 sqft_liv 识别为最重要的树结构构建中的预测因子。它还将 EV2、EV3、EV1 和 EV6 确定为之后的重要预测变量,这证实了局部空间信息也影响响应变量。因此,我们可以总结,将 EV 作为空间信息的表示形式纳入机器学习模型规范中,使它们能够捕获空间数据集的潜在空间依赖属性。结果,我们观察到机器学习模型的预测准确性有了显著提高。

Figure11

图 11: XGBoost (特征向量) 模型的前 15 个重要变量图

5 CONCLUSIONS

对机器学习模型使用空间过滤特征向量的意义很明显,因为空间特征向量与非空间协变量相互作用可以解决空间依赖性并提高机器学习模型的预测性能。此外,将这些值包含在机器学习模型规范中有助于避免创建和处理距离衰减变量的挫折,其中人为错误、数据不可用和数据兼容性 (即数据规范化/缩放) 问题会严重影响空间结果分析。此外,从空间坐标生成的空间过滤特征向量可能足以替代那些缺失的代表数据空间结构的空间协变量,这使得建模过程更容易、更可靠。总之,基于特征向量空间滤波的机器学习方法很有吸引力,因为它们能够在对空间数据建模时解决空间自相关问题,从而显著提高预测性能并有助于准确评估地理空间现象。然而,包含 200 个近似特征向量会在机器学习模型中引发巨大的计算负担;因此,在未来的工作中可以应用主成分分析方法,将近似空间特征向量集的维数缩小到更低的维数,以加快计算速度,同时保留最大的空间信息。

参考文献

  • [1] Ahasan, R. (2019a). Transit proximity and affordable housing investments: Application of hedonic model in Des Moines, Iowa. In Proceedings of the 2019 Annual Conference of the Association of Collegiate Schools of Planning, Toronto, ON, Canada.
  • [2] Ahasan, R. (2019b). Transportation accessibility, housing investments, and housing prices: Application of hedonic price model in Des Moines, Iowa (Unpublished Master of Community and Regional Planning Thesis). Ames, IA: Iowa State University.
  • [3] Akay, E. Ç., Topal, K. H., Kizilarslan, S., & Bulbul, H. (2019). Forecasting of Turkish housing price index: ARIMA, random forest, ARIMA-random forest. _Pressacademia_, 10(10), 7– 11. [https://doi.org/10.17261/pressacademia.2019.1134]
  • [4] Anselin, L. (2010). Thirty years of spatial econometrics. _Papers in Regional Science_, 89(1), 3– 25. [https://doi.org/10.1111/j.1435-5957.2010.00279.x]
  • [5] Brunsdon, C., Fotheringham, S., & Charlton, M. (1998). Geographically weighted regression. _Journal of the Royal Statistical Society, Series D: The Statistician_, 47(3), 431– 443. [https://doi.org/10.1111/1467-9884.00145]
  • [6] Can, A. (1992). Specification and estimation of hedonic housing price models. _Regional Science and Urban Economics_, 22(3), 453– 474. [https://doi.org/10.1016/0166-0462(92)90039-4]90039-4)
  • [7] Chen, J., Ong, C. F., Zheng, L., & Hsu, S. (2017). Forecasting spatial dynamics of the housing market using support vector machine. _International Journal of Strategic Property Management_, 21(3), 273– 283. [https://doi.org/10.3846/1648715x.2016.1259190]
  • [8] Chen, T., & Guestrin, C. (2016). XGBoost. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco, CA (pp. 785– 794). New York, NY: ACM. [https://doi.org/10.1145/2939672.2939785]
  • [9] Cliff, A. D., & Ord, K. (1969). Spatial autocorrelation: A review of existing and new measures with applications. Bristol, UK: University of Bristol.
  • [10] Cliff, A. D., & Ord, K. (1973). Spatial autocorrelation. New York, NY: Methuen.
  • [11] Cortes, C., & Vapnik, V. (1995). Support-vector networks. _Machine Learning_, 20(3), 273– 297. [https://doi.org/10.1007/bf00994018]
  • [12] Gehlke, C., & Biehl, K. (1934). Certain effects of grouping upon the size of the correlation coefficient in census tract material. _Journal of the American Statistical Association_, 29(185), 169– 170. [https://doi.org/10.2307/2277827]
  • [13] Georganos, S., Grippa, T., Vanhuysse, S., Lennert, M., Shimoni, M., & Wolff, E. (2018). Very high resolution object-based land use-land cover urban classification using extreme gradient boosting. _IEEE Geoscience and Remote Sensing Letters_, 15(4), 607– 611. [https://doi.org/10.1109/lgrs.2018.2803259]
  • [14] Goodchild, M. F. (2004). The validity and usefulness of laws in geographic information science and geography. _Annals of the Association of American Geographers_, 94(2), 300– 303. [https://doi.org/10.1111/j.1467-8306.2004.09402008.x]
  • [15] Goodman, A. C. (1978). Hedonic prices, price indices and housing markets. _Journal of Urban Economics_, 5(4), 471– 484. [https://doi.org/10.1016/0094-1190(78)90004-9]90004-9)
  • [16] Griffith, D. A. (1996). Spatial autocorrelation and eigenfunctions of the geographic weights matrix accompanying geo-referenced data. _Canadian Geographer_, 40(4), 351– 367. [https://doi.org/10.1111/j.1541-0064.1996.tb00462.x]
  • [17] Griffith, D. A. (2000). Eigenfunction properties and approximations of selected incidence matrices employed in spatial analyses. _Linear Algebra and its Applications_, 321(1–3), 95– 112. [https://doi.org/10.1016/s0024-3795(00)00031-8]00031-8)
  • [18] Griffith, D. A. (2003). Spatial autocorrelation and spatial filtering: Gaining understanding through theory and scientific visualization. Berlin, Germany: Springer.
  • [19] Griffith, D. A. (2020). Important considerations about space-time data: Modeling, scrutiny, and ratification. _Transactions in GIS_, 25(1), 291– 310. [https://doi.org/10.1111/tgis.12708]
  • [20] Griffith, D. A., & Chun, Y. (2013). Spatial autocorrelation and spatial filtering. In M. M. Fischer & P. Nijkamp (Eds.), Handbook of regional science (pp. 1477– 1507). Berlin, Germany: Springer. [https://doi.org/10.1007/978-3-642-23430-9_72]
  • [21] Griffith, D. A., Chun, Y., & Li, B. (2019). Spatial regression analysis using eigenvector spatial filtering. London, UK: Academic Press.
  • [22] Gyódi, K., & Nawaro, Ł. (2021). Determinants of Airbnb prices in European cities: A spatial econometrics approach. _Tourism Management_, 86, 104319. [https://doi.org/10.1016/j.tourman.2021.104319]
  • [23]
  • [24] Islam, M., Islam, K., Ahasan, R., Mia, M., & Haque, M. (2021). A data-driven machine learning-based approach for urban land cover change modeling: A case of Khulna City Corporation area. _Remote Sensing Applications: Society and Environment_, 24, 100634. [https://doi.org/10.1016/j.rsase.2021.100634]
  • [25] Janssen, C., Söderberg, B., & Zhou, J. (2001). Robust estimation of hedonic models of price and income for investment property. _Journal of Property Investment & Finance_, 19(4), 342– 360. [https://doi.org/10.1108/eum0000000005789]
  • [26] Jong, P., Sprenger, C., & Veen, F. (1984). On extreme values of Moran's _I_ and Geary's _C_. _Geographical Analysis_, 16, 17– 24. [https://doi.org/10.1111/j.1538-4632.1984.tb00797.x]
  • [27] LeSage, J. (2008). An introduction to spatial econometrics. _Revue D'économie Industrielle_, 123(3), 19– 44. [https://doi.org/10.4000/rei.3887]
  • [28] Li, H., Cao, Y., Li, S., Zhao, J., & Sun, Y. (2020). XGBoost model and its application to personal credit evaluation. _IEEE Intelligent Systems_, 35(3), 52– 61. [https://doi.org/10.1109/mis.2020.2972533]
  • [29] Lim, W. T., Wang, L., Wang, Y., & Chang, Q. (2016). Housing price prediction using neural networks. In Proceedings of the 12th International Conference on Natural Computation, Fuzzy Systems and Knowledge Discovery, Changsha, China (pp. 518– 522). Piscataway, NJ: IEEE. [https://doi.org/10.1109/fskd.2016.7603227]
  • [30] Limsombunc, V., Gan, C., & Lee, M. (2004). House price prediction: Hedonic price model vs. artificial neural network. _American Journal of Applied Sciences_, 1(3), 193– 201. [https://doi.org/10.3844/ajassp.2004.193.201]
  • [31] Miller, A. J. (1984). Selection of subsets of regression variables. _Journal of the Royal Statistical Society, Series A: General_, 147(3), 389. [https://doi.org/10.2307/2981576]
  • [32] Montero, J., Mínguez, R., & Fernández-Avilés, G. (2017). Erratum to: Housing price prediction: Parametric versus semi-parametric spatial hedonic models. _Journal of Geographical Systems_, 20(1), 107– 109. [https://doi.org/10.1007/s10109-017-0262-1]
  • [33] Munkhdalai, L., Wang, L., Park, H. W., Ryu, K. H. (2019). Advanced neural network approach, its explanation with LIME for credit scoring application. In L. Munkhdalai, L. Wang, H. W. Park, K. H. Ryu, H. Keun, N. T. Nguyen, … B. Trawiński (Eds.), Intelligent information and database systems (Lecture Notes in Computer Science, Vol. 11432, pp. 407– 419). Cham, Switzerland: Springer. [https://doi.org/10.1007/978-3-030-14802-7_35]
  • [34] Murakami, D. (2017). Spatial regression modeling using the spmoran package: Boston housing price data examples. Preprint, arXiv:1703.04467.
  • [35] Murakami, D., & Griffith, D. A. (2015). Random effects specifications in eigenvector spatial filtering: A simulation study. _Journal of Geographical Systems_, 17(4), 311– 331. [https://doi.org/10.1007/s10109-015-0213-7]
  • [36] Murakami, D., & Griffith, D. A. (2018). Eigenvector spatial filtering for large data sets: Fixed and random effects approaches. _Geographical Analysis_, 51(1), 23– 49. [https://doi.org/10.1111/gean.12156]
  • [37] Nayak, S., Misra, B., & Behera, H. (2014). Impact of data normalization on stock index forecasting. _International Journal of Computer Information Systems and Industrial Management Applications_, 6, 357– 369. Retrieved from [http://www.mirlabs.org/ijcisim/regular_papers_2014/IJCISIM_24.pdf]
  • [38] Oh, J., Ham, D., Lee, Y., & Kim, G. (2019). Short-term load forecasting using XGBoost and the analysis of hyperparameters. _Transactions of the Korean Institute of Electrical Engineers_, 68(9), 1073– 1078. [https://doi.org/10.5370/kiee.2019.68.9.1073]
  • [39] Openshaw, S. (1984). The modifiable areal unit problem. Norwich, UK: Geo Books.
  • [40] Park, B., & Bae, J. K. (2015). Using machine learning algorithms for housing price prediction: The case of Fairfax County, Virginia housing data. _Expert Systems with Applications_, 42(6), 2928– 2934. [https://doi.org/10.1016/j.eswa.2014.11.040]
  • [41] Tiefelsdorf, M., & Boots, B. (1995). The exact distribution of Moran's I. _Environment and Planning A: Economy and Space_, 27(6), 985– 999. [https://doi.org/10.1068/a270985]
  • [42] Tobler, W. R. (1970). A computer movie simulating urban growth in the Detroit region. _Economic Geography_, 46, 234– 240. [https://doi.org/10.2307/143141]
  • [43] Wang, S.-C. (2003). Interdisciplinary computing in Java programming (Springer International Series in Engineering and Computer Science, Vol. 743). Boston, MA: Springer.
  • [44] Wang, Y., Kockelman, K., & Wang, X. (2013). Understanding spatial filtering for analysis of land use-transport data. _Journal of Transport Geography_, 31, 123– 131. [https://doi.org/10.1016/j.jtrangeo.2013.06.001]
  • [45] Wu, J. (2017). Housing price prediction using support vector regression (Unpublished MS thesis). San Jose, CA: San Jose State University.
  • [46] Zhang, C., Di, L., Lin, L., & Guo, L. (2019). Machine-learned prediction of annual crop planting in the U.S. Corn Belt based on historical crop planting maps. _Computers and Electronics in Agriculture_, 166, 104989. [https://doi.org/10.1016/j.compag.2019.104989]