一、前言
场景预设
利用回归进行数据分析,在现实中具有广泛的应用,用于发现事物之间的关系。假设你是一个制造工程师,老板要求你对某化学产品的合成产出率进行分析,以便用于优化设备参数。此时,由于刚学了李宏毅老师的课,作为动手小王子的你,打算亲自动手做一下这个项目并总结处Regression进行数据分析预测时的方法论。
**声明:**本文大部分笔记理解来源于李宏毅机器学习视频课程Regression以及《Hands on machine Learning with Scikit Learn, Keras and TensorFlow》;二、Regression进行销售预测方法论
2.1 定义商业目标
在进行数据分析前,需要问问你的老板,你的需求是什么,即商业目标是什么?例如本案例中:老板要求你对下个月产品A的销售额进行预测:
- 产品的最佳设置参数是多少?
- 预测需要哪些数据?需要多少数据?需要考虑哪些影响因素?
- 以往是如何设置参数的?
- 需要选用哪些模型?线性回顾?非线性回顾?逻辑回归?SVM?…
- 如何评价模型的好坏?
- 需要达到的最低表现水平如何?
- 如果用手动解决这个问题,你要怎么解决?
- 有哪些前提假设?
代码如下(示例)