转换器
之前做特征工程的步骤:
- 1.实例化(实例化的是一个转换器类(Transformer))
- 2.调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)
将特征工程的接口称为转换器,其中转换器调用有这么几种形式: - fit_transform
-fit - transform
例如:在标准化中调用fit_tranform过程中方式生了什么?
fit_transform()
fit()---------计算每一列的平均值和标准差。
transform()------------(x-mean)/σ,进行最终的转换。
from sklearn.preprocessing import StandardScaler
std1 = StandardScaler ()
a = [[1,2,3],[4,5,6]]
array1 = std1.fit_transform(a)
print("fit_transform():\n",array1)
array2 = std1.fit(a)
print("fit():\n",array2)
array3 = std1.transform(a)
print("transform():\n",array3)
估计器(Sklearn机器学习算法的实现)
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现算法的API。
- 用于分类的估计器:
sklearn.neighbors--------------k-近邻
sklearn.naive_bayes-----------贝叶斯
sklearn.linear_model.logistic------------逻辑回归
sklearn.tree---------决策树和随机森林 - -用于回归的估计器
线性回归
岭回归 - 用于无监督学习的估计器
sklearn.cluster.k_means_ ---------聚类
估计器的工作流程:
- 实例化一个estimator
- estimator.fit(x_train,x_test)计算
调用完毕,模型生成 - 模型评估:
(1)直接对比真实值和预测值:
y_predict = estimator.predict(x_test)
y_test = y_predict
(2)计算准确率:
accuracy = estimator.score(x_test,y_test)