SkLearn学习笔记

最新推荐文章于 2024-07-18 09:40:08 发布

du_qi

最新推荐文章于 2024-07-18 09:40:08 发布

阅读量1.2k

点赞数 1

分类专栏：大数据开发文章标签： sklearn

本文链接：https://blog.csdn.net/du_qi/article/details/61616456

版权

本文介绍了scikit-learn的安装及相关项目，深入讲解了机器学习的基础，特别是正则化方法如岭回归和Lasso。讨论了它们在处理过拟合和特征选择中的作用，并提供了选择最佳正则化参数的策略。此外，还对比了生成模型和判别模型的区别。

摘要由CSDN通过智能技术生成

Welcome to scikit-learn

Installing scikit-learn

首先需要安装IPython，此时附带安装了NumPy、SciPy和matplotlib，然后使用pip install -U scikit-learn。记住，不能使用pip安装NumPy和SciPy，因为配置不恰当的话可能会导致计算慢的问题。Windows上直接安装Python(x,y)，然后在Additional plugins安装scikit-learn即可。
（文档的1.2.14节，使用n_jobs>1有时会程序崩溃的原因，没看懂）

深度学习库：pylearn2、keras
图像处理库：scikit-image
自然语言处理库：nltk、gensim

Scikit-learn Tutorials

An introduction to machine learning with scikit-learn

看下面的一段示例代码，示范了sklearn中的一些基本用法：

    from sklearn import datasets
    from sklearn import svm
    from sklearn.externals import joblib
    digits = datasets.load_digits()     #sklearn中自带了一些数据集，可用于学习sklearn的基本用法
    clf = svm.SVC(gamma=0.001, C&