统计学习精要(中文)
封面
第一章 引言
第二章 监督学习概览
2.1 导言
2.2 变量类型和术语
2.3 两种简单的预测方式:最小二乘和最近邻
2.4 统计判别理论
2.5 高维问题的局部方法
2.7 结构化的回归模型
2.8 限制性估计的种类
2.9 模型选择和偏差-方差的权衡
2.10 文献笔记
第三章 线性回归模型
3.1 导言
3.2 线性回归模型和最小二乘法
3.3 选择预测变量的子集
3.4 收缩的方法
3.5 运用派生输入方向的方法
3.6 讨论:选择和收缩方法的比较
3.7 多输出的收缩和选择
3.8 Lasso 和相关路径算法的补充
3.9 计算上的考虑
3.10 文献笔记
第四章 线性分类模型
4.1 导言
4.2 指示矩阵的线性回归
4.3 线性判别分析
4.4 逻辑斯蒂回归
4.5 分离超平面
4.6 文献笔记
第五章 基展开与正则化
5.1 导言
5.2 分段多项式和样条
5.3 过滤和特征提取
5.4 平滑样条
5.5 平滑参数
\(\lambda\)
的自动选择
5.6 非参逻辑斯蒂回归
5.7 多维样条
5.8 正则化和再生核希尔伯特空间理论
5.9 小波平滑
5.10 文献笔记
附录
第六章 核平滑方法
6.1 一维核平滑器
6.2 选择核的宽度
6.3
\(p\)
维空间中的局部回归
6.4
\(p\)
维空间中的结构化局部回归
6.5 局部似然和其他模型
6.6 核密度估计和分类
6.7 径向基函数和核
6.8 混合模型的密度估计和分类
6.9 计算上的考虑
6.10 文献笔记
第七章 模型评估与选择
7.1 导言
7.2 偏差、方差和模型复杂度
7.3 偏差-方差分解
7.4 训练误差率的乐观估计
7.5 样本内误差的估计
7.6 参数的有效个数
7.7 贝叶斯方法和 BIC
7.8 最小描述长度
7.9 VC维
7.10 交互验证
7.12 “条件测试误差”还是“测试误差的期望”?
7.13 文献笔记
第八章 模型推断与模型平均
8.1 导言
8.3 贝叶斯方法
8.5
EM
算法
8.6 从后验分布采样的 MCMC
8.7 Bagging
8.8 模型平均和堆叠
8.9 随机搜索: Bumping
8.10 文献笔记
第九章 加法模型、树及相关方法
9.1 广义可加模型
9.2 基于树的方法(CART)
9.3 PRIM
9.4 MARS: 多变量自适应回归样条
9.5 专家的分层混合
9.6 缺失数据
9.7 计算的考虑
9.8 文献笔记
第十章 提升方法和加法树
10.1 boosting方法
10.2 Boosting 拟合可加模型
10.3 向前逐步加法建模
10.4 指数损失和AdaBoost
10.5 为什么是指数损失?
10.6 损失函数和鲁棒性
10.7 数据挖掘的现货方法
10.8 例子: 垃圾邮件
10.9 Boosting 树
10.10 Gradient Boosting的数值优化
10.11 大小合适的boosting树
10.12 正则化
10.13 解释性
10.14 例子
10.15 文献笔记
第十一章 神经网络
11.1 导言
11.2 投影寻踪回归
11.3 神经网络
11.4 拟合神经网络
11.5 训练神经网络的一些问题
11.6 例子:模拟数据
11.7 例子:邮编数据
11.8 文献笔记
第十二章 支持向量机与柔性判别分析
12.1 导言
12.2 支持向量分类器
12.3 支持向量机和核
12.4 广义线性判别分析
12.5 FDA
12.6 惩罚判别分析
12.7 混合判别分析
12.8 文献笔记
计算上的考虑
第十三章 原型方法与最近邻方法
13.1 导言
13.2 原型方法
13.3 k最近邻分类器
13.4 自适应最近邻方法
13.5 计算上的考虑
13.6 文献笔记
第十四章 非监督学习
14.1 导言
14.2 关联规则
14.3 聚类分析
14.4 自组织图
14.5 主成分,主曲线和主曲面
14.6 非负矩阵分解
14.7 独立成分分析和探索投影寻踪
14.8 多维缩放
14.9 非线性降维和局部多维缩放
14.10 谷歌的PageRank算法
14.11 文献笔记
第十五章 随机森林
15.1 导言
15.2 随机森林的定义
15.3 随机森林的细节
15.4 随机森林的分析
15.5 文献笔记
第十六章 集成学习
16.1 导言
16.2 Boosting 和正则化路径
16.3 学习集成
16.4 文献笔记
第十七章 马尔科夫随机场
17.1 导言
17.2 马尔科夫图及其性质
17.3 连续变量的无向图模型
17.4 离散变量的无向图模型
17.5 文献笔记
第十八章 高维度问题
18.1 当p远大于N
18.2 对角线性判别分析和最近收缩重心
18.3 二次正则化的线性分类器
18.4
\(L_1\)
正则的线性分类器
18.5 当特征不可用时的分类
18.6 高维回归: 有监督的主成分
18.7 特征评估和多重检验问题
18.8 文献笔记
repository
open issue
Index