jieba词典_02-jieba、贝叶斯、LRegressionCV

69f57e826940c08948fc0af56ca3d9da.png

1.1 jieba

(1)Python中文分词 jieba 十五分钟入门与进阶

https://blog.csdn.net/FontThrone/article/details/72782499​blog.csdn.net

(2 )GitHub

https://github.com/fxsjy/jieba​github.com

(3)调整词典

  • 使用 add_word(word, freq=None, tag=None)del_word(word) 可在程序中动态修改词典。
  • 使用 suggest_freq(segment, tune=True) 可调节单个词语的词频,使其能(或不能)被分出来。
  • 注意:自动计算的词频在使用 HMM 新词发现功能时可能无效。

1.2 MultinomialNB

在scikit-learn中,一共有3个朴素贝叶斯的分类算法类。分别是GaussianNB,MultinomialNB和BernoulliNB。其中GaussianNB就是先验为高斯分布的朴素贝叶斯,MultinomialNB就是先验为多项式分布的朴素贝叶斯,而BernoulliNB就是先验为伯努利分布的朴素贝叶斯。

    这三个类适用的分类场景各不相同,一般来说,如果样本特征的分布大部分是连续值,使用GaussianNB会比较好。如果如果样本特征的分大部分是多元离散值,使用MultinomialNB比较合适。而如果样本特征是二元离散值或者很稀疏的多元离散值,应该使用BernoulliNB。

sklearn.naive_bayes.MultinomialNB - scikit-learn 0.21.3 documentation​scikit-learn.org
d86ced9ec6c6808e3b6a5e918039602d.png
scikit-learn 朴素贝叶斯类库使用小结​www.cnblogs.com Zzr blog​zhangzirui.github.io
e672fc60a97f6bae9c6aa914c5c3d707.png

1.3 LogisticRegressionCV

3.2.4.1.5. sklearn.linear_model.LogisticRegressionCV - scikit-learn 0.21.3 documentation​scikit-learn.org scikit-learn 逻辑回归类库使用小结​www.cnblogs.com https://blog.csdn.net/evolution23/article/details/85028423​blog.csdn.net
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值