关于估计器和转换器
关于如果看是分类问题还是回归问题
-
分类: 目标值数据是离散型
-
回归:目标值数据是连续型
-
转换器
- fit_transform(),意思就是先进行fit(),进行数据拟合,然后再进行transform() 进行标准化处理,一般来说对于训练集数据,我们应该对数据先进行拟合再进行标准化处理,因为使用fit.transform()是为了找到训练集上的方差、均值等等,但是在测试集上我们只需要对数据进行标准化处理而不需要进行拟合,所以对测试集进行transform() 即可。
- s = StandardScaler()
s.fit_transform(X_train)
-
估计器(sklearn机器学习算法的实现)
-
在sklearn中,估计器(estimator)是一个重要的角色(LinearRegression、LogisticRegression、LASSO、Ridge),是一类实现了算法的API
-
1、用于分类的估计器:
sklearn.neighbors k-近邻算法
from sklearn.naive_bayes import GaussianNB, MultinomialNB, BernoulliNB 贝叶斯 (一般用于文本分类)
sklearn.linear_model.LogisticRegression 逻辑回归
sklearn.tree 决策树与随机森林sklearn.svm import SVC 支持向量机
2、用于回归的估计器:
sklearn.linear_model.LinearRegression 线性回归
sklearn.linear_model.Ridge 岭回归sklearn.linear_model.Lasso Lasso回归
from sklearn.neighbors import KNeighborsRegressor 回归
ElasticNet回归 : ElasticNet是Lasso和Ridge回归技术的混合体
from sklearn.tree import DecisionTreeRegressor 决策树回归
from sklearn.ensemble import RandomForestRegressor 随机森林
from sklearn.svm import SVR # 支持向量机回归
3、用于无监督学习的估计器
sklearn.cluster.KMeans 聚类
-
实例化一个估计器
estimator = LNeighborsClassifier()
传入训练数据集,进行机器训练
estimator.fit(x_train,y_train)
模型评估
方法1. 比较真实值与预测值
y_ = estimator.predict(x_test)
方法2. 计算模型准确率
estimator.score(x_test,y_test)
-
-
在Sklearn当中有三大模型:Transformer 转换器、Estimator 估计器、Pipeline 管道
Pipeline 管道
将Transformer、Estimator 组合起来成为一个大模型。
管道: 输入→□→□→□→■→ 输出
□:Transformer ; ■:Estimator ;
Transformer放在管道前几个模型中,而Estimator 只能放到管道的最后一个模型中。
————————————————