机器学习之朴素贝叶斯

目录

前言

1、核心思想

2、应用领域

一、数学基础

二、贝叶斯

三、朴素贝叶斯

1、定义

2、拉普拉斯平滑系数

四、API

1、API

2、案例

五、总结


 

前言

        朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理特征条件独立性假设的常见的机器学习分类算法。这种方法的名称中的“朴素”一词,源于其对特征之间独立性的简化假设,即假设所有特征之间相互独立,互不影响。尽管在实际问题中这种完全独立的情况并不多见,但这种假设恰恰使得朴素贝叶斯在面对高维度数据时依然能够保持快速且相对准确的分类能力。

1、核心思想

        朴素贝叶斯的核心思想是在给定一组特征的情况下,计算各个类别出现的可能性,然后选择可能性最大的类别作为预测结果。其关键之处在于“朴素”假设,即将复杂的多维条件概率简化为单个特征的条件概率的乘积。

2、应用领域

        朴素贝叶斯分类器在文本分类、垃圾邮件过滤、情感分析、文档分类等文本相关的问题中得到了广泛应用,同时也适用于医学诊断、金融欺诈检测等领域。它的优点包括模型简单、易于实现、对缺失数据不敏感,但缺点是对特征的条件独立性有较强的假设,可能导致在某些情况下分类效果不佳。

 

 

一、数学基础

af8f01c0b2804dd4b4829a6d88a9711e.png

 

 

二、贝叶斯

26f3a40b43274d78bfee1b9ff8c5b77d.png

 

 

三、朴素贝叶斯

1、定义

f56fb47096a34ddfa60784de99981c20.png

2、拉普拉斯平滑系数

9696998114c14ca6973dbf7b2102fab7.png

 

 

四、API

1、API

80573940921241089e3d2e25c09a5abf.png

2、案例

(1)  流程

  • 1)获取数据

  • 2)数据基本处理

    • 2.1) 取出内容列,对数据进行分析

    • 2.2) 判定评判标准

    • 2.3) 选择停用词

    • 2.4) 把内容处理,转化成标准格式

    • 2.5) 统计词的个数

    • 2.6)准备训练集和测试集

  • 3)模型训练

  • 4)模型评估

(2)  数据展示

133b976a804b4d2980979009ad8416c1.png

(三)  代码实现

ef352ccf3bf04a52ad2b4837caf6638d.png

35cf9944aad84b57811a556124a5f4f0.png

 

五、总结

        总的来说,朴素贝叶斯是一种简单而有效的分类算法,特别适用于特征之间条件独立的情况,并且在数据量较小的情况下表现良好。

 

  • 13
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值