scikit-learn：在实际项目中用到过的知识点（总结）

最新推荐文章于 2024-07-02 20:02:58 发布

置顶

mmc2015

最新推荐文章于 2024-07-02 20:02:58 发布

阅读量7.1k

点赞数 7

分类专栏： scikit-learn ML in coding 文章标签：机器学习 scikit-learn 实际项目应用

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mmc2015/article/details/47079409

版权

这篇博客总结了scikit-learn在实际项目中的应用，包括数据预处理、文本分类、模型选择和评估。重点介绍了加载数据、特征提取、交叉验证、网格搜索等关键步骤，并探讨了SVM、随机森林、AdaBoost和梯度提升等机器学习模型在监督和无监督学习中的应用。

摘要由CSDN通过智能技术生成

零、所有项目通用的：

http://blog.csdn.net/mmc2015/article/details/46851245（数据集格式和预测器）

http://blog.csdn.net/mmc2015/article/details/46852755（加载自己的原始数据）

（适合文本分类问题的整个语料库加载）

http://blog.csdn.net/mmc2015/article/details/46906409（5. 加载内置公用的数据）

（常见的很多公共数据集的加载，5. Dataset loading utilities）

http://blog.csdn.net/mmc2015/article/details/46705983（Choosing the right estimator（你的问题适合什么estimator来建模呢））

（一张图告诉你，你的问题选什么estimator好，再也不用试了）

http://blog.csdn.net/mmc2015/article/details/46857949（训练分类器、预测新数据、评价分类器）

http://blog.csdn.net/mmc2015/article/details/46858009（使用“Pipeline”统一vectorizer => transformer => classifier、网格搜索调参）

一、文本分类用到的：

http://blog.csdn.net/mmc2015/article/details/46857887（从文本文件中提取特征（tf、idf））

（CountVectorizer、TfidfTransformer）

http://blog.csdn.net/mmc2015/article/details/46866537（

最低0.47元/天解锁文章

关注

7
点赞
踩
13

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。