美赛python学习d10机器学习——分类算法

朴素贝叶斯算法

贝叶斯定理在这里插入图片描述

用朴素贝叶斯算法进行分类

e.g:已知用户开车(步行)上班随薪水和年龄的分布,预测一个新用户是开车还是步行上班

在这里插入图片描述
步骤:

  1. 求已知新用户特征,其步行上班的概率
  • 求先验概率:用户步行上班的概率
    在这里插入图片描述
  • 求特征概率:在新用户周围画一个圈,圈内的用户的年龄与薪水和新用户很相近,
    用圈内的老用户数除以总的老用户数,代表新用户特征(年龄和薪水)的概率
    在这里插入图片描述
  • 求条件的似然(已知用户是步行上班,求其满足新用户特征的概率):
    在这里插入图片描述
    在这里插入图片描述
  1. 利用同样的方式计算已知新用户特征,其开车上班的概率
    在这里插入图片描述
  2. 比较两个后验概率的值,将用户分到概率大的那一类

一些注意事项

  1. 为什么叫“朴素”
    假设:数据的所有特征都是独立不相关的
  2. 如何巧妙地避开特征概率的计算
    在这里插入图片描述
    因为最后是两个后验概率的比较,所以直接比较分子就行了
  3. 将分类不止两类,有多类怎么办
    算出所有种类的后验概率再进行比较
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值