Datawhale 第7期 《李宏毅机器学习》任务四

学习打卡内容:

  • 从基础概率推导贝叶斯公式,朴素贝叶斯公式(1)
  • 学习先验概率(2)
  • 学习后验概率(3)
  • 学习LR和linear regreeesion之间的区别(4)
  • 推导sigmoid function公式(5)

Q1: 用回归模型是否可以做分类?
最好不要。
如果有一个二分类问题并且已经得到一个回归模型,这时候就有人会把分类当作回归硬解。例如把回归预测值更接近-1的部分划分为1类,更接近1的部分划分为2类,这么做就有可能产生一下问题:

在这里插入图片描述
训练集添加有很多的距离远大于1的数据后,分界线从绿色偏移到紫色。而事实上原先的绿色分界线的效果反而比紫色的效果好。

还有另外一个问题:比如多分类,类别1当作target1,类别2当作target2,类别3当作target3…如果这样做的话,就会认为类别2和类别3是比较接近的,认为它们是有某种关系的;认为类别1和类别2也是有某种关系的,比较接近的。但是实际上这种关系不存在,它们之间并不存在某种特殊的关系。这样是没有办法得到好的结果。

Q2: 生成模型 generative model
对一个二分类模型,可以利用贝叶斯公式 p ( c 1 ∣ x ) = p ( x ∣ c 1 ) p ( c 1 ) p ( x ∣ c 1 ) p ( c 1 ) + p ( x ∣ c 2 ) p ( c 2 ) p(c_1|x)=\dfrac{p(x|c_1)p(c_1)}{p(x|c_1)p(c_1)+p(x|c_2)p(c_2)} p(c1x)=p(xc1)p(c1)+p(xc2)p(c2)p(xc1)p(c1)计算该属性对应的类别,这一套方法称为生成模型。根据该模型可以生成x的分布 p ( x ) = p ( x ∣ c 1 ) p ( c 1 ) + p ( x ∣ c 2 ) p ( c 2 ) p(x)=p(x|c_1)p(c_1)+p(x|c_2)p(c_2) p(x)=p(xc1)p(c1)+p(xc2)p(c2),就可以自己去生成x。

Q3: 先验概率 prior probability
是指根据以往经验和分析得到的概率。是在缺乏某个事实的情况下描述一个变量,而后验概率是在考虑了一个事实之后的条件概率。

Q4:后验概率
后验概率的计算要以先验概率为基础。后验概率可以根据通过贝叶斯公式,用先验概率和似然函数计算出来

Q5:推导朴素贝叶斯假设
朴素贝叶斯的一个重要假设是各特征之间相互独立,利用此假设可从简单的概率推导出朴素贝叶斯:在已知特征x的情况下求所属类别的概率 p ( c ∣ x ) = p ( x ∣ c ) ∗ p ( c ) p ( x ) = p ( x 1 , x 2 , . . . , x n ∣ c ) ∗ p ( c ) ∑ k p ( x ∣ c i ) ∗ p ( c i ) = ∏ n p ( x i ∣ c ) ∗ p ( c ) ∑ k p ( x ∣ c i ) ∗ p ( c i ) p(c|x)=\dfrac{p(x|c)*p(c)}{p(x)}=\dfrac{p(x_1,x_2,...,x_n|c)*p(c)}{\sum_k{p(x|c_i)*p(c_i)}}=\dfrac{\prod_np(x_i|c)*p(c)}{\sum_k{p(x|c_i)*p(c_i)}} p(cx)=p(x)p(xc)p(c)=kp(xci)p(ci)p(x1,x2,...,xnc)p(c)=kp(xci)p(ci)np(xic)p(c)
在利用朴素贝叶斯做判断时,主要是比较各类别的概率,所以与分母无关,那么就可以只计算分子,从而得到:
在这里插入图片描述
Q6:LR和linear regression之间的区别与区别
1、逻辑回归和线性回归都是广义的线性回归
2、线性模型的优化目标函数是最小二乘,而逻辑回归则是似然函数
3、线性回归的输出是实域上连续值,LR的输出值被S型函数映射到[0,1],通过设置阀值转换成分类类别
4、liner regression期望拟合训练数据,通过feature的线性加权来预测结果; logistic regression是在训练一个最大似然分类器。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值