高斯分布

一维情况 MLE

高斯分布在机器学习中占有举足轻重的作用。在 MLE 方法中:

一般地,高斯分布的概率密度函数PDF写为:

带入 MLE 中我们考虑一维的情况

首先对 的极值可以得到 : 于是: 其次对 中的另一个参数 ,有: 于是: 值得注意的是,上面的推导中,首先对 求 MLE, 然后利用这个结果求 ,因此可以预期的是对数据集求期望时 是无偏差的: 但是当对 求 期望的时候由于使用了单个数据集的 ,因此对所有数据集求期望的时候我们会发现 是 有偏的:

所以:

多维情况

多维高斯分布表达式为: 其中 为协方差矩阵,一般而言也是半正定矩阵。这里我们只考虑正定矩阵。首先我们处理指数上的数字,指数上的数字可以记为 之间的马氏距离。对于对称的协方差矩阵可进行特征值分解, ,于是:

我们注意到 在特征向量 上的投影长度,因此上式子就是 取不同值时的同心椭圆。

下面我们看多维高斯模型在实际应用时的两个问题

  1. 参数 的自由度为 对于维度很高的数据其自由度太高。解决方案:高自由度的来源是 个自由参数,可以假设其是对角矩阵,甚至在各向同性假设中假设其对角线上的元素都相同。前一种的算法有 Factor Analysis,后一种有概率 PCA(p-PCA) 。

  2. 第二个问题是单个高斯分布是单峰的,对有多个峰的数据分布不能得到好的结果。解决方案:高斯混合GMM 模型。

下面对多维高斯分布的常用定理进行介绍。

我们记 ,已知

首先是一个高斯分布的定理:

定理:已知 ,那么

证明:

下面利用这个定理得到 这四个量。

  1. ,代入定理中得到: 所以

  2. 同样的,

  3. 对于两个条件概率,我们引入三个量: 特别的,最后一个式子叫做 的 Schur Complementary。可以看到: 所以: 利用这三个量可以得到 。因此:

    这里同样用到了定理。

  4. 同样: 所以:

下面利用上边四个量,求解线性模型:

已知:,求解:

解:令 ,所以 ,因此: 引入 ,我们可以得到 。对于这个协方差可以直接计算: 注意到协方差矩阵的对称性,所以 。根据之前的公式,我们可以得到: