3.1 导言¶

线性回归模型假设回归函数 \(\mathbb{E}(Y\mid X)\) 关于输入变量 \(X_1,X_2,\ldots,X_p\) 是线性的。虽然线性模型大部分是在统计学的 前计算机时期 (precomputer age of statistics) 发展的，但即使在今天的 计算机时代 (computer era) 仍然有很好的理由去学习、使用线性模型。

note “weiya 注：统计推断的历史发展” Bradley Efron 和 Trevor Hastie 在 2016 年出了一本书 Computer Age Statistical Inference，按照历史发展介绍了统计推断。按照那本书的划分，第一部分为 Classical Inference，第二部分为 Early Computer Age(1950s-1990s)，第三部分为 Twenty-First-Century(1900s-present)。

因为它们简单，而且经常能够对输入变量怎样影响输出变量这一问题给出充分的、可解释性的描述。做预测时，线性模型有时比 更花哨的 (fancier) 非线性模型表现得还要好，特别是在 训练样本 (training cases) 很少、低信噪比或者稀疏数据的情况下。

最后，线性方法可以应用到输入变量的变换上，这在很大程度上扩大了其使用范围。这些推广有时被称作基函数方法，将在第 5 章中讨论。

这一章中我们描述用于回归的线性方法，下一章我们将讨论用于分类的线性方法。在某些主题上我们将详细讨论，因为我们坚信理解线性方法对于理解非线性是至关重要的。实际上，许多非线性技巧是线性方法的直接推广。

统计学习精要(中文)

3.1 导言

3.1 导言¶