6.8 混合模型的密度估计和分类
6.8 混合模型的密度估计和分类¶
混合模型是用于密度估计的有力工具,而且可以看成一种核方法。高斯混合模型有如下形式:
其中混合比例 \(\alpha_m\) 满足 \(\sum_m\alpha_m=1\),并且每个高斯密度均值为 \(\mu_m\),协方差阵为 \(\Sigma_m\)。一般地,混合模型可以用任意组分来替换式( 6.32 ) 的高斯密度:高斯混合模型是至今最受欢迎的。
这些参数通常用极大似然法来拟合,采用 第 8 章 中描述的 EM 算法。下面是一些特殊情形:
如果协方差阵约束为标量:\(\boldsymbol{\Sigma}_m=\sigma_m I\),则式( 6.32 ) 有径向基展开的形式。
如果另外固定 \(\sigma_m=\sigma>0\),并且 \(M\uparrow N\),则 式( 6.32 ) 的极大似然估计会近似 \(\hat\alpha_m=1/N,\hat\mu_m=x_m\) 时的核密度估计( 式 6.22 )。
回顾
\[ \hat f(x_0)=\frac{1}{N\lambda}\sum\limits_{i=1}^NK_\lambda(x_0,x_i)\tag{6.22} >\]
利用贝叶斯定理,将每个类别的混合密度分离开,则得到 \(\mathrm{Pr}(G\mid X)\) 的灵活模型;这将在 第 12 章 详细讨论。
图 6.17 展示了混合模型应用到心脏病风险因子研究中。最上面一行是 no CHD
、CHD
关于 Age
的直方图,然后结合起来得到最右边的直方图。采用结合后的数据,我们拟合形如 式( 6.32 ) 的两组分混合模型,其中(标量)协方差阵 \(\boldsymbol{\Sigma}_1\) 和 \(\boldsymbol{\Sigma}_2\) 不要求相等。通过 EM 算法来拟合:注意到过程中没用到 CHD
标签的信息。估计的结果为
组分密度 \(\phi(\hat\mu_1,\hat\Sigma_1)\) 和 \(\phi(\hat\mu_2,\hat\Sigma_2)\) 展示在图 6.17 中第二行的前两幅图中。右下角的图展示了组分密度(橘黄色和蓝色)以及估计的混合密度(绿色)。
混合模型同样给出了观测 \(i\) 属于组分 \(m\) 的概率的估计
其中在我们例子中 \(x_i\) 是 Age
。假设对每个 \(\hat\gamma_{i2}\) 设阈值,并且定义 \(\hat\delta_i=I(\hat\gamma_{i2}>0.5)\)。接着我们比较根据 CHD
和混合模型分类的结果
尽管混合模型没有用到 CHD
标签,但还是较好地发现了两个 CHD
子总体。线性逻辑斯蒂回归当采用 CHD
作为响应变量,用极大似然拟合数据达到相同的误差率 \((32\%)\)。