jieba词典_02-jieba、贝叶斯、LRegressionCV

最新推荐文章于 2023-08-02 12:26:23 发布

weixin_39639600

最新推荐文章于 2023-08-02 12:26:23 发布

阅读量109

点赞数

文章标签： jieba词典

1.1 jieba

（1）Python中文分词 jieba 十五分钟入门与进阶

https://blog.csdn.net/FontThrone/article/details/72782499blog.csdn.net

（2 ）GitHub

https://github.com/fxsjy/jiebagithub.com

（3）调整词典

使用 add_word(word, freq=None, tag=None) 和 del_word(word) 可在程序中动态修改词典。
使用 suggest_freq(segment, tune=True) 可调节单个词语的词频，使其能（或不能）被分出来。
注意：自动计算的词频在使用 HMM 新词发现功能时可能无效。

1.2 MultinomialNB

在scikit-learn中，一共有3个朴素贝叶斯的分类算法类。分别是GaussianNB，MultinomialNB和BernoulliNB。其中GaussianNB就是先验为高斯分布的朴素贝叶斯，MultinomialNB就是先验为多项式分布的朴素贝叶斯，而BernoulliNB就是先验为伯努利分布的朴素贝叶斯。

　　　　这三个类适用的分类场景各不相同，一般来说，如果样本特征的分布大部分是连续值，使用GaussianNB会比较好。如果如果样本特征的分大部分是多元离散值，使用MultinomialNB比较合适。而如果样本特征是二元离散值或者很稀疏的多元离散值，应该使用BernoulliNB。

sklearn.naive_bayes.MultinomialNB - scikit-learn 0.21.3 documentationscikit-learn.org

scikit-learn 朴素贝叶斯类库使用小结www.cnblogs.com Zzr blogzhangzirui.github.io

1.3 LogisticRegressionCV

3.2.4.1.5. sklearn.linear_model.LogisticRegressionCV - scikit-learn 0.21.3 documentationscikit-learn.org scikit-learn 逻辑回归类库使用小结www.cnblogs.com https://blog.csdn.net/evolution23/article/details/85028423blog.csdn.net

weixin_39639600

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
jieba词典_02-jieba、贝叶斯、LRegressionCV

1.1 jieba（1）Python中文分词 jieba 十五分钟入门与进阶https://blog.csdn.net/FontThrone/article/details/72782499blog.csdn.net（2 ）GitHubhttps://github.com/fxsjy/jiebagithub.com（3）调整词典使用 add_word(word, freq=None, tag=...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。