机器学习关键步骤（二）

最新推荐文章于 2021-11-04 21:02:13 发布

playwrighter

最新推荐文章于 2021-11-04 21:02:13 发布

阅读量2.1k

点赞数 2

分类专栏： Python数据分析人工智能文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_15378385/article/details/113743782

版权

Python数据分析同时被 2 个专栏收录

77 篇文章 8 订阅

订阅专栏

59 篇文章 2 订阅

订阅专栏

机器学习关键步骤（二）

机器学习有四个关键步骤。

(1) 数据准备，理和准备待分析的数据。

(2) 算法选择，根据需求挑选算法为数据建立模型。

(3) 参数调优，优化模型结果。

(4) 模型评估，根据准确度评价模型选出最好的。

2算法选择

2　选择算法

如何选择算法，取决于任务类型。任务大致可以分为 3 大类，每一类对应一些算法，如表所示。
表各种算法及其对应的任务类型
在这里插入图片描述

2.1　无监督学习

任务目标：指出数据中隐藏的模式。

当希望找出数据集中隐藏的模式时，可以使用 k 均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法。之所以称之为无监督学习算法，是因为不知道要找的模式是什么，而是要依靠算法从数据集中发现模式。

以上表中的数据为例，可以应用无监督学习模型找出哪些商品是顾客经常搭配购买的，或者根据购买的商品对顾客进行分类、）。

通过间接手段，可以对无监督学习模型输出的结果进行验证，比如检查得到的顾客分类是否与我们熟悉的分类（如食草动物和食肉动物）相符合。

2.2　监督学习

任务目标：使用数据中的模式做预测。

当需要做预测时，就会用到回归分析、k 最近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法。之所以称之为监督学习算法，是因为它们的预测都基于已有的模式。

以上表中的数据为例，监督学习模型可以根据“顾客类别”以及“是否买鱼”（二者皆为预测变量）来预测“水果购买量”。

通过输入非表中顾客的预测变量值（“顾客类别”和“是否买鱼”），并且对比预测结果和实际的“水果购买量”，可以直接评估监督学习模型的准确度。

像“水果购买量”这样的整型数值或连续数值的预测过程，实际上是在解决回归问题，如图a所示。二元值或分类值的预测过程，如预测是否会下雨，则是在解决分类问题，如图b 所示。尽管如此，大部分分类算法也可以生成连续的概率值，比如预测“降水概率是 75%”，这种预测精度更高。

在这里插入图片描述

回归会产生一条趋势线，而分类则会把数据点分组。请注意，这两项任务都可能出错：在回归过程中，某些数据点可能会远离趋势线；在分类过程中，某些数据点可能被错误地分组

2.3　强化学习

任务目标：使用数据中的模式做预测，并根据越来越多的反馈结果不断改进。

无监督学习模型和监督学习模型在部署之后便无法更改。不同于此，强化学习模型自身可以通过反馈结果不断改进。

暂且抛开上表中的动物顾客，举一个实际的例子：假设要比较两个在线广告的效果。首先，让这两个广告的投放频率一样，然后确定每个广告的点击人数。接着，利用强化学习模型把点击人数作为衡量广告受欢迎程度的指标，并根据这个指标提高受欢迎广告的投放频率。通过这样的迭代过程，模型不断得到改进，最终会让广告投放取得更好的效果。

2.4　注意事项

除了要了解算法适用的任务类型之外，还要了解它们在其他方面的不同，比如各种算法对不同数据类型的分析能力，以及结果的本质。

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
机器学习关键步骤（二）

机器学习关键步骤（二）机器学习有四个关键步骤。(1) 数据准备，理和准备待分析的数据。(2) 算法选择，根据需求挑选算法为数据建立模型。(3) 参数调优，优化模型结果。(4) 模型评估，根据准确度评价模型选出最好的。2算法选择2.2　选择算法本书将讨论 10 多种用于分析数据的算法。如何选择算法，取决于任务类型。任务大致可以分为 3 大类，每一类对应一些算法，如表 1-3 所示。表 1-3　各种算法及其对应的任务类型2.2.1　无监督学习任务目标：指出数据中隐藏的模式。当希望找出数
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。