如何用Python在10分钟内建立一个预测模型

最新推荐文章于 2023-09-02 00:05:34 发布

weixin_34310785

最新推荐文章于 2023-09-02 00:05:34 发布

阅读量1.6k

点赞数

文章标签： python 数据结构与算法大数据

原文链接：https://yq.aliyun.com/articles/81200

版权

0?wx_fmt=jpeg

引言

最近，我从孙子（指《孙子兵法》——译者注）那里学到了一些策略：速度和准备

0?wx_fmt=png

速度与准备

“兵之情主速，乘人之不及，由不虞之道，攻其所不戒也。”（《孙子兵法•九地篇》）无备为战之大患，有备无患，其乃至德也。（哈哈，译者自己写了这句，想必大家能明白。）

这与数据科学博客有什么关系呢？这是你赢得竞争和编程马拉松的关键。如果你比竞争对手准备得更充分，你学习、迭代执行的速度越快，那么你就取得更好的名次，带来更好的结果。

由于近几年来，Python用户数量上涨及其本身的简洁性，使得这个工具包对数据科学世界的Python专家们变得有意义。本文将帮助你更快更好地建立第一个预测模型。绝大多数优秀的数据科学家和kagglers建立自己的第一个有效模型并快速提交。这不仅仅有助于他们领先于排行榜，而且提供了问题的基准解决方案。

0?wx_fmt=png

预测模型的分解过程

我总是集中于投入有质量的时间在建模的初始阶段，比如，假设生成、头脑风暴、讨论或理解可能的结果范围。所有这些活动都有助于我解决问题，并最终让我设计出更强大的商业解决方案。为什么你要在前面花费这段时间，这有充分的理由：

你有足够的时间投入并且你是无经验的（这是有影响的）
你不带有其它数据观点或想法的偏见（我总是建议，在深入研究数据之前做假设生成）
在后面的阶段，你会急于完成该项目而没有能力投入有质量的时间了。

这个阶段需要投入高质量时间，因此我没有提及时间表，不过我建议你把它作为标准的做法。这有助于你建立建立更好地预测模型，在后面的阶段的只需较少的迭代工作。让我们来看看建立第一个模型的剩余阶段的时间表：

数据描述性分析——50%的时间
数据预处理（缺失值和异常值修复）——40%的时间
数据建模——4%的时间
性能预测——6%的时间

让我们一步一步完成每个过程（每一步投入预测的时间）：

阶段1：描述性分析/数据探索

最低0.47元/天解锁文章

weixin_34310785

关注

0
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
如何用Python在10分钟内建立一个预测模型

引言最近，我从孙子（指《孙子兵法》——译者注）那里学到了一些策略：速度和准备速度与准备“兵之情主速，乘人之不及，由不虞之道，攻其所不戒也。”（《孙子兵法•九地篇》）无备为战之大患，有备无患，其乃至德也。（哈哈，译者自己写了这句，想必大家能明白。）这与数据科学博客有什么关系呢？这是你赢得竞争和编程马拉松的关键。如果你比竞争对手准备得更充分，你...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。