一、转换器
- 实例化(实例化一个转换器类Transformer)
- 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)
我们将特征工程的接口称之为转换器,其中转换器调用有这么几种形式(以标准化为例)
- fit_transform 包含以下两种方法,是fit和transform的整合
- fit 计算每一列的平均值、标准差
- transform 计算(x-mean)/std
二、估计器(sklearn机器算法的实现)
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API
- 用于分类的估计器
- sklearn.neighbors k-近邻算法
- sklearn.naive_bayes 贝叶斯
- sklearn.linear_model.LogisticRegression 逻辑回归
- sklearn.tree 决策树与随机森林
- 用于回归的估计器
- sklearn.linear_model.LinearRegression 线性回归
- sklearn.linear_model.Ridge 岭回归
- 用于无监督学习的估计器
- sklearn.cluster.Kmeans 聚类
估计器的工作流程
- 实例化一个estimator
- 调用estimator.fit(x_train,y_train)计算
调用完毕,模型生成 - 模型评估
方法1:直接比对真实值和预测值 y_predict = estimator.predict(x_test)
方法2:计算准确率 accuracy = estimator.score(x_test,y_test)