{ "cells": [ { "cell_type": "markdown", "id": "cae180ff", "metadata": {}, "source": [ " # 第 7 章 高斯过程\n", "\n", "\n", "\n", "在上一章中,我们学习了狄利克雷过程,它是狄利克雷分布的无限维推广,可用于设置未知连续分布的先验。在本章中,我们将学习高斯过程,这是高斯分布的无限维推广,可用于设置未知函数的先验。在贝叶斯统计中,狄利克雷过程和高斯过程都被用来建立灵活的模型,其中允许参数的数量随着数据的大小而增加。\n", "\n", "本章我们将学习:\n", "\n", "- 函数作为概率对象\n", "- 协方差函数与核\n", "- 具有高斯似然的高斯过程\n", "- 具有非高斯似然的高斯过程\n", "---\n", "\n", "## 7.1 线性模型和非线性数据\n", "\n", "在第3章 “线性回归建模” 和 第4章 “广义线性回归模型” 中,介绍了如何构建一般形式的模型:\n", "\n", "\n", "$$\n", "\\theta=\\psi(\\phi(X) \\beta) \\tag{式7.1} \n", "$$\n", "\n", " 式 7.1 中, $\\theta$ 是因变量概率分布的某个参数,如高斯分布的平均值 $\\mu$ 、二项式的参数 $p$、泊松分布的比率 $\\lambda$ 等。$\\psi$ 为逆连接函数,$\\phi$ 是平方根或多项式函数,$\\beta$ 为线性回归的权重参数。对于最简单的一元线性回归情况,$\\psi$ 为恒等函数。\n", "\n", "对上述贝叶斯模型的拟合可以视为通过推断得到权重参数 $\\beta$ 的后验分布,因此,被称为估计的`权重视角(Weight View)`。以多项式回归为例,通过设计非线性函数 $\\phi$ ,可将输入映射到特征空间,然后在特征空间中拟合一个在实际空间中非线性的线性关系。理论上通过使用适当阶次的多项式,总是可以完美拟合任何函数。但除非应用一定形式的正则化(如使用强先验),否则多项式回归很容易导致过拟合,进而模型泛化能力变差。\n", "\n", "`高斯过程` 让数据决定函数的复杂度,在避免(或最小化)过拟合问题同时,为任意函数的建模提供了理论解决方案,为复杂问题建模提供了一种 `函数视角 (Function View)` 。\n", "\n", "以下各节从实用角度解释了高斯过程,几乎避免了所有数学知识。有关更正式的解释,请查看`第 9 章 『下一步去哪里?』`中列出的资源。\n", "\n", "## 7.2 什么是高斯过程?\n", "\n", "### 7.2.1 如何为函数建模?\n", "\n", " 我们将首先描述一种将函数表示为概率对象的方法,以开始对高斯过程的讨论。可以把函数 $f$ 看作是从一组输入 $x$ 到一组输出 $y$ 的映射。因此,可以这样写:\n", "\n", "$$\n", "y=f(x) \\tag{式7.2} \n", "$$\n", "\n", "表示函数的一种方式是为每个值 $x_i$ 列出其相应值 $y_i$ 。事实上,你可能还记得小时候这种函数的表示方式:\n", "\n", "