2-02-转化器与预估器

最新推荐文章于 2023-05-19 21:06:02 发布

yuhui_2000

最新推荐文章于 2023-05-19 21:06:02 发布

阅读量216

点赞数

分类专栏：黑马程序员3天快速入门Python机器学习文章标签：算法机器学习 python 深度学习决策树

本文链接：https://blog.csdn.net/yuhui_2000/article/details/114845288

版权

黑马程序员3天快速入门Python机器学习专栏收录该内容

27 篇文章 4 订阅

订阅专栏

主要内容

分类算法：

目标值：类别

sklearn转换器与预估器
KNN算法
模型选择与调优
朴素贝叶斯算法
决策树
随机森林

sklearn转换器与预估器

转换器

预估器

estimator

转换器-特征工程的父类

在这里插入图片描述

标准化

$X^{\prime}=\frac{x-mean}{\sigma}$

fit_transform()

将方法fit()和方法transform()进行封装，最终得到了方法fit_transform()

换而言之即是：

fit_transform() = fit() + transform()

fit()

计算每一列的平均值、标准差，为利用公式计算 $X^{\prime}$ 做准备

transform()

将方法fit()计算出来的值代入公式中，最终计算出 $X^{\prime}$ 的值

这几个方法之间的区别是什么呢？

我们看以下代码就清楚了

In [1]: from sklearn.preprocessing import StandardScaler

In [2]: std1 = StandardScaler()

In [3]: a = [[1,2,3], [4,5,6]]

In [4]: std1.fit_transform(a)
Out[4]:
array([[-1., -1., -1.],
       [ 1.,  1.,  1.]])

In [5]: std2 = StandardScaler()

In [6]: std2.fit(a)
Out[6]: StandardScaler(copy=True, with_mean=True, with_std=True)

In [7]: std2.transform(a)
Out[7]:
array([[-1., -1., -1.],
       [ 1.,  1.,  1.]])

从中可以看出，fit_transform的作用相当于transform加上fit。

但是为什么还要提供单独的fit呢, 我们还是使用原来的std2来进行标准化看看

In [8]: b = [[7,8,9], [10, 11, 12]]

In [9]: std2.transform(b)
Out[9]:
array([[3., 3., 3.],
       [5., 5., 5.]])

In [10]: std2.fit_transform(b)
Out[10]:
array([[-1., -1., -1.],
       [ 1.,  1.,  1.]])

预估器-sklearn机器学习算法的实现

在这里插入图片描述

预估器工作流程

在这里插入图片描述

实例化一个estimator类
estimator.fit(x_train,y_train)
- 计算
- 做机器学习的训练
- 训练完毕之后生成模型
模型评估
- 直接比对真实值和预测值
  - y_predict = estimator.predict(x_test)
  - y_test == y_predict
- 计算准确率
  - accuracy = estimator.score(x_test, y_test)

在这里插入图片描述