基于朴素贝叶斯的文本分类器

        如果别人给你推荐一篇文章,只给你说了文章名字,那么你现在最好奇的应该是:这文章是什么类型的??类型直接决定了你会不会去看,还有就是如果别人给你说这文章是情感类的,听完你也许比较感兴趣但读完后发现这文章是军事类的,那么你会很不爽,多影响情绪,所以文章的所属类型还是必须要很准确的。像我之前实习的一家公司就是给人推送广告的,公司强调精准,意思很明了就是要把广告推送给可能会需要广告中所推产品的人们,我们技术人员拿到的只是简单的广告文案,而不清楚这个文案所属的类别,由于广告文案特别过,不可能每个都要人工来进行分类,所以我们的工作就是训练模型让机器来分。

        首先我们需要有足够的训练集,而且要比较准确,假设我们把训练集的文章放在了路径train_data_folder下,要预测的文章放在了路径test_data_folder下,

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值