《python机器学习—预测分析核心算法》：构建预测模型的一般流程

最新推荐文章于 2023-08-12 22:32:55 发布

weixin_30411997

最新推荐文章于 2023-08-12 22:32:55 发布

阅读量1k

点赞数

文章标签： python 人工智能数据结构与算法

原文链接：http://www.cnblogs.com/feinaio2017/p/8504149.html

版权

参见原书1.5节

构建预测模型的一般流程

问题的日常语言表述->问题的数学语言重述
重述问题、提取特征、训练算法、评估算法

熟悉不同算法的输入数据结构：
1.提取或组合预测所需的特征
2.设定训练目标
3.训练模型
4.评估模型在训练数据上的性能表现

机器学习：
开发一个可以实际部署的模型的全部过程，包括对机器学习算法的理解和实际的操作

通常，有非常切实的原因，导致某些算法被经常使用，了解背后的原因

(1)构造一个机器学习问题
审视数据集中的数据，确定需要做何种形式的预测
如，这些数据代表什么？如何与预测任务关联起来？

1.“更好的结果”->可测量可优化的具体目标
2.收集数据，表示为特征的矩阵
3.目标：已知正确的数据结果用于训练

<------问题重构---------<-
| |
问题的定性描述->问题的数学描述->模型训练与性能评估->模型部署

(2)特征提取和特征工程
特征提取： (将决定哪些特征可以用来预测目标)
把一个自由形式的各种数据(如一个文档中的字词)转换为行、列形式的数字的过程

特征工程：
对特征进行整理组合，以达到更富有信息量的过程

算法，提供每个特征对最终预测结果贡献的度量
对特征打分，标识重要性

注意：数据准备和特征工程估计会占开发一个机器学习模型80%~90%的时间

通常训练100~5000个不同的模型，然后选择与问题、数据集最匹配的模型

(3)确定训练后模型的性能
测试集：留出一部分数据，用于测试模型的性能

转载于:https://www.cnblogs.com/feinaio2017/p/8504149.html

weixin_30411997

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
《python机器学习—预测分析核心算法》：构建预测模型的一般流程

参见原书1.5节构建预测模型的一般流程问题的日常语言表述->问题的数学语言重述重述问题、提取特征、训练算法、评估算法熟悉不同算法的输入数据结构：1.提取或组合预测所需的特征2.设定训练目标3.训练模型4.评估模型在训练数据上的性能表现机器学习：开发一个可以实际部署的模型的全部过程，包括对机器学习算法的理解和实际的操作通常，有非常切实的原因，导致某些算法被经常使用，了解背后...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。