介绍
鉴于Python在过去几年中的兴起及其简洁性,对于数据科学领域的Python学家意义重大。这篇文章会用最容易的方式引导你更快地构建第一个预测模型。
出乎意料的简单!10分钟用python进行人工智能建立预测模型
揭秘预测建模的过程
我一直专注于在模型构建的初始阶段投入质量时间,如假设生成/脑力激荡会议/讨论或理解领域。所有这些活动都帮助我解决问题,最终导致我设计出更强大的业务解决方案。有充分理由说明你应该事先花时间:
1. 你有足够的时间进行投资而且你很新鲜(它有影响力)
2. 您不会对其他数据点或想法产生偏见(我总是建议,在深入挖掘数据之前进行假设生成)
3. 在稍后阶段,您将急于完成项目并且无法花费高质量的时间
这个阶段需要一个高质量的时间,所以我不在这里提及时间表,我建议你把它作为标准做法。它将帮助您构建更好的预测模型,从而减少后期工作的迭代次数。让我们看看第一个模型构建中的剩余阶段和时间轴:
让我们看看第一个模型构建中的剩余阶段和时间轴
1. 对数据的描述性分析 - 50%的时间
2. 数据处理(缺失值和异常值修复) - 40%的时间
3. 数据建模 - 4%的时间
4. 性能评估 - 6%的时间
PS这是仅用于第一个模型构建的时间的分割
让我们一步一步地完成这个过程(估算每个步骤花费的时间):
第1阶段:描述性分析/数据探索:
作为数据科学家的最初几天,数据探索过去常常花费很多时间。随着时间的推移,已经对数据进行了大量自动化操作。鉴于数据准备占据了构建第一个模型的50%的工作,