我的sklearn学习经验

最新推荐文章于 2021-01-30 20:12:16 发布

才能我浪费

最新推荐文章于 2021-01-30 20:12:16 发布

阅读量254

收藏

点赞数 1

分类专栏：比赛经验

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hawkman/article/details/103790690

版权

比赛经验专栏收录该内容

7 篇文章 0 订阅

订阅专栏

scikit-learn是python进行数据挖掘与分析的重要而有效的工具，学习scikit-learn最重要的资料来源就是它的官网：

http://scikit-learn.org/stable/index.html

一进官网就能看到它的6大功能：

classification

Regression

Clustering

Dimensionality reduction

Model selection

Preprocessing

它的API模块包括：

sklearn.base: Base classes and utility function

sklearn.cluster: Clustering

sklearn.cluster.bicluster: Biclustering

sklearn.covariance: Covariance Estimators

sklearn.model_selection: Model Selection

sklearn.datasets: Datasets

sklearn.decomposition: Matrix Decomposition

sklearn.dummy: Dummy estimators

sklearn.ensemble: Ensemble Methods

sklearn.exceptions: Exceptions and warnings

sklearn.feature_extraction: Feature Extraction

sklearn.feature_selection: Feature Selection

sklearn.gaussian_process: Gaussian Processes

sklearn.isotonic: Isotonic regression

sklearn.kernel_approximation: Kernel Approximation

sklearn.kernel_ridge: Kernel Ridge Regression

sklearn.discriminant_analysis: Discriminant Analysis

sklearn.linear_model: Generalized Linear Models

sklearn.manifold: Manifold Learning

sklearn.metrics: Metrics

sklearn.mixture: Gaussian Mixture Models

sklearn.multiclass: Multiclass and multilabel classification

sklearn.multioutput: Multioutput regression and classification

sklearn.naive_bayes: Naive Bayes

sklearn.neighbors: Nearest Neighbors

sklearn.neural_network: Neural network models

sklearn.calibration: Probability Calibration

sklearn.cross_decomposition: Cross decomposition

sklearn.pipeline: Pipeline

sklearn.preprocessing: Preprocessing and Normalization

sklearn.random_projection: Random projection

sklearn.semi_supervised: Semi-Supervised Learning

sklearn.svm: Support Vector Machines

sklearn.tree: Decision Tree

sklearn.utils: Utilities

经常玩数据比赛的人就会发现classification，Regression，Clustering，Dimensionality reduction，Model selection，Preprocessing这几样都会经常用到的。尤其是classification和Regression，不过如果你直接用他们进行分类或者回归，不对数据进行预处理和其他的操作的话，成绩通常不太会太好。

其实scikit-learn学习还真没有太多好说的，因为文档写的很好，而且例代码也很多，一般情况拿过例代码，调一调就好了。

比如你想试一下linear_model的Ridge，直接访问：

http://scikit-learn.org/stable/modules/linear_model.html

看一下Ridge的说明，如果想试一下，里面的例代码都写好了：

>>> from sklearn import linear_model

>>> reg = linear_model.Ridge (alpha = .5)

>>> reg.fit ([[0, 0], [0, 0], [1, 1]], [0, .1, 1])

Ridge(alpha=0.5, copy_X=True, fit_intercept=True, max_iter=None,

normalize=False, random_state=None, solver='auto', tol=0.001)

>>> reg.coef_

array([ 0.34545455, 0.34545455])

>>> reg.intercept_

0.13636...

用起来的顺序大概就是

1，拿过来，跑一下，理解一下。

2，改一改，代入自己的数据，跑一下，看看结果。

3，调一调参数，优化一下。

如果你在想了解函数的参数怎么回事，点击这个文档里这个函数的链接就行了啊。比如ridgeCV:

http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.RidgeCV.html#sklearn.linear_model.RidgeCV

就酱，你已经成为一个合格的调包侠了。

才能我浪费

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值