![](https://img-blog.csdnimg.cn/20190927151132530.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Scikit-Learn
Scikit-Learn专栏
梦码城
以梦为码,不负韶华
展开
-
sklearn模型保存
from sklearn import svmfrom sklearn import datasetsimport pickle # 保存模块clf = svm.SVC()iris = datasets.load_iris()x, y = iris.data, iris.targetclf.fit(x, y)"""方法一:使用 pickle 保存"""# 保存Model(注:save文件夹要预先建立,否则会报错)with open('save/clf.pickle', 'wb') as原创 2022-01-09 22:47:55 · 763 阅读 · 0 评论 -
交叉验证_分类
from sklearn.model_selection import cross_val_score # K折交叉验证模块from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_split # 分割数据模块from sklearn.neighbors import KNeighborsClassifier # K最近邻(kNN,k-NearestNeighbor)分类算法impo原创 2022-01-09 22:46:35 · 477 阅读 · 0 评论 -
交叉验证_回归
from sklearn.model_selection import cross_val_score, train_test_splitfrom sklearn.datasets import load_irisfrom sklearn.neighbors import KNeighborsClassifierimport matplotlib.pyplot as pltiris = load_iris()x = iris.datay = iris.targetk_range = rang原创 2022-01-09 22:46:00 · 261 阅读 · 0 评论 -
validation_curve检视过拟合
from sklearn.model_selection import validation_curvefrom sklearn.datasets import load_digitsfrom sklearn.svm import SVCimport matplotlib.pyplot as pltimport numpy as npdigits = load_digits()x = digits.datay = digits.target# 建立参数集param_range = np原创 2022-01-09 22:45:21 · 1314 阅读 · 0 评论 -
LearningCurve检视过拟合
from sklearn.model_selection import learning_curvefrom sklearn.datasets import load_digitsfrom sklearn.svm import SVC # Support Vector Classifierimport matplotlib.pyplot as pltimport numpy as np"""加载digits数据集,其包含的是手写体的数字,从0到9。数据集总共有1797个样本,每个样本由64个特原创 2022-01-09 22:44:41 · 277 阅读 · 0 评论 -
sklearn做Normalization正则化
# 数据标准化模块from sklearn import preprocessing# 将资料分割成train与test的模块from sklearn.model_selection import train_test_split# 生成适合做classification资料的模块from sklearn.datasets._samples_generator import make_classification# Support Vector Machine中的Support Vector C原创 2022-01-09 22:43:15 · 251 阅读 · 0 评论 -
sklearn模型属性与方法
from sklearn import datasetsfrom sklearn.linear_model import LinearRegressionimport matplotlib.pyplot as pltloaded_data = datasets.load_boston()data_x = loaded_data.datadata_y = loaded_data.targetmodel = LinearRegression()# model.fit 用来训练模型model.原创 2022-01-09 22:42:14 · 298 阅读 · 0 评论 -
sklearn强大数据库
from sklearn import datasetsfrom sklearn.linear_model import LinearRegressionimport matplotlib.pyplot as pltloaded_data = datasets.load_boston()data_x = loaded_data.datadata_y = loaded_data.targetmodel = LinearRegression()model.fit(data_x,data_y)原创 2022-01-09 22:41:00 · 824 阅读 · 0 评论 -
sklearn机器学习通用解决方案
从 START 开始,首先看数据的样本是否 >50,小于则需要收集更多的数据。由图中,可以看到算法有四类,分类,回归,聚类,降维。其中 分类和回归是监督式学习,即每个数据对应一个 label。 聚类 是非监督式学习,即没有 label。 另外一类是 降维,当数据集有很多很多属性的时候,可以通过 降维 算法把属性归纳起来。例如 20 个属性只变成 2 个,注意,这不是挑出 2 个,而是压缩成为 2 个,它们集合了 20 个属性的所有特征,相当于把重要的信息提取的更好,不重要的信息就不要了。然后看.转载 2022-01-09 22:39:55 · 89 阅读 · 0 评论