线性回归--SPSS与Python使用对比
介绍:
1.数据描述: 波士顿房价数据
2.构建数据集(csv)作为SPSS输入
3.使用SPSS线性回归分析
4.使用Python线性回归分析与预测
5.使用Python梯度下降分析与预测
1
数据描述
![85be1d591e1011c73bf0dab23c8250bf.png](https://img-blog.csdnimg.cn/img_convert/85be1d591e1011c73bf0dab23c8250bf.png)
房价一直是普罗大众关心的问题,影响房价的因素有很多,今天我们来探索一下如何使用用不同的工具进行房价分析。
在这次学习中,我们选用sklearn的房价数据集来探索
![85be1d591e1011c73bf0dab23c8250bf.png](https://img-blog.csdnimg.cn/img_convert/85be1d591e1011c73bf0dab23c8250bf.png)
话不多说,直接上代码
![85be1d591e1011c73bf0dab23c8250bf.png](https://img-blog.csdnimg.cn/img_convert/85be1d591e1011c73bf0dab23c8250bf.png)
#导入numpy包和pandas包
import pandas as pd
import numpy as np
#设置不使用科学计数法显示数据
np.set_printoptions(suppress=True)
#导入sklearn中的boston房价数据集
from sklearn.datasets import load_boston
#构造csv文件作为spss数据集加载使用
lb = load_boston()
#先查看一下数据集,lb.data 是属性的意思
lb.data
#看一下目标值的前十10个数据
lb.target[:10]
#这样子看好像不太直观,我们再整理一下
#把数据集用DataFrame包装起来
bos = pd.DataFrame(lb.data)
#lb.feature_names 代表数据集属性名,赋给bos.columns
bos.columns = lb.feature_names
#获取目标值
bos['price'] = lb.target
#现在我们再次查看一下数据集前5行
bos.head()
#一共有13个特征,一个目标值,也就是price列
![337c21c528c44c1e8c537693c3ec22db.png](https://img-blog.csdnimg.cn/img_convert/337c21c528c44c1e8c537693c3ec22db.png)
2
构建csv数据集作为SPSS输入