python 多元线性回归 pandas_用scikit-learn和pandas学习线性回归的方法

最新推荐文章于 2024-05-17 11:53:13 发布

weixin_39574287

最新推荐文章于 2024-05-17 11:53:13 发布

阅读量606

点赞数

文章标签： python 多元线性回归 pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39574287/article/details/111735402

版权

对于想深入了解线性回归的童鞋，这里给出一个完整的例子，详细学完这个例子，对用scikit-learn来运行线性回归，评估模型不会有什么问题了。

1. 获取数据，定义问题

没有数据，当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。

里面是一个循环发电场的数据，共有9568个样本数据，每个数据有5列，分别是:AT(温度), V(压力), AP(湿度), RH(压强), PE(输出电力)。我们不用纠结于每项具体的意思。

我们的问题是得到一个线性的关系，对应PE是样本输出，而AT/V/AP/RH这4个是样本特征，机器学习的目的就是得到一个线性回归模型，即:

PE=θ0+θ1∗AT+θ2∗V+θ3∗AP+θ4∗RH而需要学习的，就是\(\theta_0, \theta_1, \theta_2, \theta_3, \theta_4\)这5个参数。

2. 整理数据

下载后的数据可以发现是一个压缩文件，解压后可以看到里面有一个xlsx文件，我们先用excel把它打开，接着“另存为“”csv格式，保存下来，后面我们就用这个csv来运行线性回归。

打开这个csv可以发现数据已经整理好，没有非法数据，因此不需要做预处理。但是这些数据并没有归一化，也就是转化为均值0，方差1的格式。也不用我们搞，后面scikit-learn在线性回归时会先帮我们把归一化搞定。

好了，有了这个csv格式的数据，我们就可以大干一场了。

3.用pandas来读取数据

我们先打开ipython notebook,新建一个notebook。当然也可以直接在python的交互式命令行里面输入，不过还是推荐用notebook。下面的例子和输出我都是在notebook里面跑的。

先把要导入的库声明了：

import matplotlib.pyplot as plt

%matplotlib inline

import numpy as np

import pandas as pd

from sklearn import datasets, linear_model

接着我们就可以用pandas读取数据了：

# read_csv里面的参数是csv在你电脑上的路径，此处csv文件放在notebook运行目录下

最低0.47元/天解锁文章

weixin_39574287

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python 多元线性回归 pandas_用scikit-learn和pandas学习线性回归的方法

对于想深入了解线性回归的童鞋，这里给出一个完整的例子，详细学完这个例子，对用scikit-learn来运行线性回归，评估模型不会有什么问题了。1. 获取数据，定义问题没有数据，当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。里面是一个循环发电场的数据，共有9568个样本数据，每个数据有5列，分别是:AT(温度), V(压力), AP(湿度), RH(压强), PE...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。