机器学习——朴素贝叶斯分类器

本文介绍了如何使用朴素贝叶斯分类器进行图书分类,以机器学习的方式减少人力成本。通过条件概率和贝叶斯公式,解释了如何判断新书是否属于计算机类,展示了机器学习的基本原理和在实际问题中的应用。
摘要由CSDN通过智能技术生成

假设现在要构建一个网络图书馆,我们可以给新进来的书贴上若干个标签,没有机器学习算法的情况下,我们需要给这些书手动分类,是计算机类的呀,还是非计算机类的呀,是小说类的呀,还是非小说类的云云。
那么,我们可以通过让程序自己学习如何通过一本书上的若干标签来进行图书类别的区分,这样就可以节省很多人力,这也是机器学习的魅力体现。
机器学习的基本原理是通过开发者给出这个程序一个学习集进行学习,再通过用户给的用户数据集进行学习的过程,机器学习包含很多的算法,当然,有大量数据的前提下,机器学习就和统计学密不可分,学习的时候有很高的耦合。这个图书馆图书分类器就是用到了概率论中的贝叶斯公式。
很奇怪为什么图书分类能和一个概率论公式挂上关系对吧?下面就详细分析一下:
首先,先回顾一下用到的概率论知识,这里需要知道两个公式,一个是条件概率公式,另一个就是贝叶斯公式啦。
条件概率公式:设A,B是两个条件
P(A|B)=P(AB)/P(B)
什么意思呢?就是说,如果A发生的条件是B先发生,那么A发生的概率就是B发生的前提下A和B同时发生。这就是上面那个公式的意义了。举个栗子来说,小红进女厕所,分析一下,首先小红得是个女的,然后她才能进了女厕所。。。这就是小红是女的的前提下小红进了女厕所,如果小红是女的事件为A,小红进女厕所事件为B,那这个概率就是P(B|A)=P(AB)/P(A),就是这个意思(随便举个栗子不要介意。。。简单明了嘛)。
贝叶斯公式是基于条件概率的


                
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值