记常用的sklearn库的使用（1）

最新推荐文章于 2023-11-13 22:23:47 发布

我是小飞猪

最新推荐文章于 2023-11-13 22:23:47 发布

阅读量491

点赞数

分类专栏： Python 文章标签： sklearn

本文链接：https://blog.csdn.net/weixin_43477082/article/details/84935823

版权

Python 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

本篇只只在使用，不记载原理，当字典用。排版不是很好，可以使用搜索ctrl+F

PCA主成成分分析
from sklearn.decomposition import PCA # 主成分分析算法
pca = PCA(n_components= 5) # 选择成分5个
pca.fit(X_train) # 训练X
X_train = pca.fit_transform(X_train)

在使用真是数据预测的时候这样写：
X_test = pca.fit_transform(X_test)

其他的方法也是如此
from sklearn.manifold import TSNE 等方法
超参数空间搜索
clf 是你自己的分类器
from sklearn.model_selection import GridSearchCV
para = {
‘learning_rate’:[0.008,0.01,0.013,0.05],
‘n_estimators’:[660,500,550],
‘max_features’:[2,3,4,5],
‘subsample’:[0.87,0.9,0.93,0.88,0.96]
}
grid = GridSearchCV(clf,para)
然后可以输出grid的各种属性等知晓那些参数最佳的值，使用者值重新进行分类器分类
同时也可以在GridSearchCV中有很多参数属性，比如cv，使用交叉验证等，可以按ctrl+B查看源码。
3.有很多刚开始学的会发觉，分类器只输出类别，但是想输出概率，别慌：
分类器有一个类别是
predict_proba（），这个就是输出概率值啦
4.sklearn 中聚类
from sklearn.cluster import hierarchical # 分层聚类
from sklearn.mixture import GaussianMixture # 高斯混合模型
from sklearn.cluster import KMeans# k均值聚类
等等

5.集成学习
from sklearn.ensemble
几种集成学习在这个类里面

6.交叉验证，自动搜索
from sklearn.model_selection import cross_val_score,cross_val_predict,GridSearchCV

7.度量等工具都在，得分啊，F1分数，等等
from sklearn.metrics 里面

8.各种模型
from sklearn.linear_model import ElasticNet, Lasso, BayesianRidge, LassoLarsIC,LinearRegression
from sklearn.svm import SVR
from sklearn.ensemble import RandomForestRegressor, GradientBoostingRegressor
from sklearn.kernel_ridge import KernelRidge
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import RobustScaler
from sklearn.base import BaseEstimator, TransformerMixin, RegressorMixin, clone
from sklearn.model_selection import KFold, cross_val_score
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import GridSearchCV
import xgboost as xgb
import lightbgm as lgb

我是小飞猪

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
记常用的sklearn库的使用（1）

本篇只只在使用，不记载原理，当字典用。排版不是很好，可以使用搜索ctrl+FPCA主成成分分析from sklearn.decomposition import PCA # 主成分分析算法pca = PCA(n_components= 5) # 选择成分5个pca.fit(X_train) # 训练XX_train = pca.fit_transform(X_train)在使用真是...
复制链接

扫一扫