朴素贝叶斯负值问题

这是使用word2vector + MultinomialNB训练时会出现的一个问题。由于word2vector对文本数据集进行处理后,向量中出现了负值,而MultinomialNB要求训练集中不出现负值

参考文章:https://stats.stackexchange.com/questions/169400/naive-bayes-questions-continus-data-negative-data-and-multinomialnb-in-scikit

MultinomialNB assumes that features have multinomial distribution which is a generalization of the binomial distribution. Neither binomial nor multinomial distributions can contain negative values.

如果不想继续对向量进行归一化之类的处理,那么可以考虑使用GaussianNB或其他分类算法;
如果还是想用MultinomialNB,那么可以尝试将数据归一化,可以使用preprocessing.MinMaxScaler来处理。参考文章:关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化,需要注意的是,在默认的(0,1)范围对数据进行缩放,可能预测的准确率会很低,那么可以通过下列方法来调优。要做好心理准备,即使调到最佳的范围,准确率也不一定高。

MinMaxScaler(feature_range=(0,10))  #自定义区间

原文链接:https://www.jianshu.com/p/d20eb52ef997

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值