机器学习模块总结

最新推荐文章于 2024-05-22 17:02:55 发布

Danker01

最新推荐文章于 2024-05-22 17:02:55 发布

阅读量598

点赞数

分类专栏：数据分析数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42575020/article/details/82877420

版权

数据分析同时被 2 个专栏收录

38 篇文章 23 订阅

订阅专栏

34 篇文章 6 订阅

订阅专栏

Sklearn 是基于Python的机器学习工具模块。里面主要包含了6大模块：分类、回归、聚类、降维、模型选择、预处理。

根据Sklearn 官方文档资料，下面将各个模块中常用的模型函数总结出来。

1. 回归及分类（监督学习）

1.1 广义线性模型 (fromsklearn import linear_model)

最小二乘法：拟合一个线性模型, 使得数据集实际观测数据和预测数据（估计值）之间残差平方和最小。

clf=linear_model.LinearRegression(), clf.fit(X,y)

岭回归：改良的最小二乘，解决共线问题。

clf=linear_model.Ridge(alpha=0.5)，clf.fit(X,y)

逻辑回归：

clf=linear_model.LogisticRegression()

1.2 朴素贝叶斯

高斯模型: from sklearn.naive_bayes import GassianNB

Gnb=GassianNB(),gnb.fit(data, target).predict(data)

多项式模型：MultinomialNB

伯努利模型：会把输入数据二元化BernoulliNB

1.3 决策树 from sklearn import tree

决策树分类器：clf=tree.DecisionTreeClassifier()

回归分类器（y 值为float非int）：

clf=tree. DecisionTreeRegressor()

1.4 支持向量机

from sklearn import svm

clf=svm.SVC()

2. 聚类

K-means:

from sklearn.cluster import KMeans

kmeans= KMeans(n_clusters=2, random_state=0).fit(X)

3. 降维

PCA:

From sklearn.decomposition import PCA

pca = PCA(n_components=2)

method:

fit(X[y])

get_covariance()

get_params([deep])

get_precision()

score(X[y])

4. 特征选择

树特征：

From sklearn.ensemble import ExtraTreesClassifier

5 .数据预处理

From sklearn import preprocessing

标准化：preprocessing.scale(x)

规范化：preprocessing.normalize()

二值化: preprocessing.Binarizer()

处理缺失值：fromsklearn.preprocessing import Imputer

imp=Imputer(missing_values='NaN',strategy='mean',axis=0)

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习模块总结

Sklearn 是基于Python的机器学习工具模块。里面主要包含了6大模块：分类、回归、聚类、降维、模型选择、预处理。根据Sklearn 官方文档资料，下面将各个模块中常用的模型函数总结出来。1. 回归及分类（监督学习）1.1 广义线性模型 (fromsklearn import linear_model)最小二乘法：拟合一个线性模型, 使得数据集实际观测...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。