3.1 导言

3.1 导言

线性回归模型假设回归函数 \(\mathbb{E}(Y\mid X)\) 关于输入变量 \(X_1,X_2,\ldots,X_p\) 是线性的。虽然线性模型大部分是在统计学的 前计算机时期 (precomputer age of statistics) 发展的,但即使在今天的 计算机时代 (computer era) 仍然有很好的理由去学习、使用线性模型。

note “weiya 注:统计推断的历史发展” Bradley Efron 和 Trevor Hastie 在 2016 年出了一本书 Computer Age Statistical Inference,按照历史发展介绍了统计推断。按照那本书的划分,第一部分为 Classical Inference,第二部分为 Early Computer Age(1950s-1990s),第三部分为 Twenty-First-Century(1900s-present)。

因为它们简单,而且经常能够对输入变量怎样影响输出变量这一问题给出充分的、可解释性的描述。做预测时,线性模型有时比 更花哨的 (fancier) 非线性模型表现得还要好,特别是在 训练样本 (training cases) 很少、低信噪比或者稀疏数据的情况下。

最后,线性方法可以应用到输入变量的变换上,这在很大程度上扩大了其使用范围。这些推广有时被称作基函数方法,将在第 5 章中讨论。

这一章中我们描述用于回归的线性方法,下一章我们将讨论用于分类的线性方法。在某些主题上我们将详细讨论,因为我们坚信理解线性方法对于理解非线性是至关重要的。实际上,许多非线性技巧是线性方法的直接推广。