生成模型学习笔记:从高斯判别分析到朴素贝叶斯

本文介绍了生成模型的概念,包括判别模型和生成模型的区别。重点讲解了高斯判别分析(GDA),解释了多元高斯正态分布及其在GDA中的应用。此外,还探讨了GDA与逻辑回归的关系以及朴素贝叶斯模型,特别是朴素贝叶斯在文本分类中的应用和拉普拉斯平滑处理。
摘要由CSDN通过智能技术生成

机器之心专栏

作者:张威

翻译:燕子石


本文是哥伦比亚大学研究生张威在生成模型上的学习笔记,由毕业于新西兰奥克兰理工大学的燕子石翻译。机器之心之前曾介绍过张威所写的吴恩达《机器学习》课程的学习笔记


  • 英文原版地址:https://wei2624.github.io/MachineLearning/sv_generative_model/

  • 中文翻译地址:https://air-yan.github.io/machine%20learning/Generative-Learning-Algorithm/


1 判别模型


判别模型是一种对观测数据进行直接分类的模型,常见的模型有逻辑回归和感知机学习算法等。此模型仅对数据进行分类,并不能具象化或者量化数据本身的分布状态,因此也无法根据分类生成可观测的图像。


定义上,判别模型通过构建条件概率分布 p(y|x;θ) 预测 y,即在特征 x 出现的情况下标记 y 出现的概率。此处 p 可以是逻辑回归模型。


2 生成模型


与判别模型不同,生成模型首先了解数据本身分布情况,并进一步根据输入 x,给出预测分类 y 的概率。该模型有着研究数据分布形态的概念,可以根据历史数据生成新的可观测图像。


贝叶斯分类就是一个典型的例子。在这个例子中,我们有一个先验分类,根据这个先验分类,我们可以使用贝叶斯原理计算每个分类的概率,然后取概率最高的概率。同时,我们还可以根据特定的先验生成特征。这就是一个生成过程。


3 高斯判别分析


高斯判别分析(GDA)是一个生成模型,其中 p(x|y) 是多元高斯正态分布。


3.1 多元高斯正态分布


在多元正态分布中,一个随机变量是一个在维度为 n 的 Rn 空间中的矢量值。因此,多元高斯的均值向量 μ∈Rn,协方差矩阵Σ∈Rn x n,其中$ \ Sigma 是对称的半正定矩阵。其概率密度函数为:

 

640?wx_fmt=png



如上所述,μ是期望值。


向量值随机变量 Z 的协方差为:

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值