scikit-learn:在实际项目中用到过的知识点(总结)

这篇博客总结了scikit-learn在实际项目中的应用,包括数据预处理、文本分类、模型选择和评估。重点介绍了加载数据、特征提取、交叉验证、网格搜索等关键步骤,并探讨了SVM、随机森林、AdaBoost和梯度提升等机器学习模型在监督和无监督学习中的应用。
摘要由CSDN通过智能技术生成

零、所有项目通用的:

http://blog.csdn.net/mmc2015/article/details/46851245数据集格式和预测器


http://blog.csdn.net/mmc2015/article/details/46852755(加载自己的原始数据

适合文本分类问题的 整个语料库加载)


http://blog.csdn.net/mmc2015/article/details/46906409(5. 加载内置公用的数据

(常见的很多公共数据集的加载5. Dataset loading utilities


http://blog.csdn.net/mmc2015/article/details/46705983(Choosing the right estimator(你的问题适合什么estimator来建模呢)

一张图告诉你,你的问题选什么estimator好,再也不用试了)


http://blog.csdn.net/mmc2015/article/details/46857949(训练分类器、预测新数据、评价分类器


http://blog.csdn.net/mmc2015/article/details/46858009(使用“Pipeline”统一vectorizer => transformer => classifier、网格搜索调参





一、文本分类用到的:

http://blog.csdn.net/mmc2015/article/details/46857887(从文本文件中提取特征(tf、idf)

CountVectorizerTfidfTransformer


http://blog.csdn.net/mmc2015/article/details/46866537(

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值