写程序学ML:朴素贝叶斯算法原理及实现(二)

本文介绍了如何实现朴素贝叶斯算法,包括训练分类器、创建词汇表、样本处理以及分类函数的详细步骤。通过函数trainNB0()、createVocabList()、setOfWords2Vec()、bagOfWords2Vec()和classifyNB(),演示了在机器学习中应用朴素贝叶斯算法的过程。
摘要由CSDN通过智能技术生成

[题外话]近期申请了一个微信公众号:平凡程式人生。有兴趣的朋友可以关注,那里将会涉及更多更新机器学习、OpenCL+OpenCV以及图像处理方面的文章。

2、朴素贝叶斯算法的实现

2.1   朴素贝叶斯算法的实现

按照朴素贝叶斯算法的原理,我们需要实现一个朴素贝叶斯分类器。首先,需要使用文本样例对贝叶斯分类器进行训练。可以按照下面的流程进行处理:

1、  定义函数:deftrainNB0(trainMatrix, trainCategory)来实现贝叶斯分类器相关数据的训练。

2、  收入参数:trainMatrix:存储每个文档样本中各个词汇在词汇表里出现情况的数据,与样本数目相同。trainCategory: 存储每个文档样本所属类别的标签,即分类信息。当前我们分为类别1和类别0两大类。类别1在trainCategory中用1表示,类别0用0表示。

3、  获取trainMatrix中样本个数、词汇表的长度以及样本中类别1所占的比例。

4、  利用贝叶斯分类器对文

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值