声明:
- 参考用Sckit-Learn和Pandas学习线性回归
- 入门机器学习仅仅靠这一篇文章还是有些不够,建议大家戳一戳文中的链接,看一下相关的知识。
从简单的线性回归入门机器学习
虽然本文从一开始就限定了机器学习的方法——线性回归,但是在大多数情况下,解决问题的主要难点在于寻找合适的机器学习方法上。而这方面需要长期的积累,所以显然不是本文要讲的内容了。
下面,本文将用面向过程的方式分解解决线性回归问题的步骤(每一个章节标题都是一个步骤),以此来帮助大家对机器学习有一个初步的了解。
获取数据,定义问题
没有数据,当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。
数据的介绍戳戳戳
数据的下载地址戳戳戳
里面是一个循环发电场的数据,共有9568个样本数据,每个数据有5列,分别是:AT(温度), V(压力), AP(湿度), RH(压强),
PE(输出电力)。我们不用纠结于每项具体的意思。我们的问题是得到一个线性的关系,对应PE是样本输出,而AT/V/AP/RH这4个是样本特征, 机器学习的目的就是得到一个线性回归模型,即:
PE=θ0+θ1∗AT+θ2∗V