统计学习第十三周-回归分析实践

最新推荐文章于 2024-07-11 10:56:28 发布

笨鸟的GPS

最新推荐文章于 2024-07-11 10:56:28 发布

阅读量168

点赞数

分类专栏：统计学

原文链接：https://blog.csdn.net/Julysxl/article/details/104230101

版权

统计学专栏收录该内容

18 篇文章 3 订阅

订阅专栏

学习内容

汽车销量数据建模（汽车销量与什么因素有关？）

暂未有很好的资料参考学习，下次继续补充完善

1.导入包和读取数据

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

data=pd.read_csv(r'C:\Users\Administrator\Desktop\data.csv')
data

在这里插入图片描述

#判断是否存在有特征值里面含有空值
data.isnull().any()

在这里插入图片描述
从上面可以看出特征值中，公路里程数存在空值。

#将特征中的空值用均值进行填充
data['公路里程数']=data['公路里程数'].fillna(data['公路里程数'].mean())

划分数据，将数据分为特征数据和标签数据。取特征数据中的有效数据特征。

label=data[['消费者信心指数']].copy()
train=data.iloc[:,2:]
train=train.drop(['消费者信心指数'],axis=1)
train

在这里插入图片描述

label

在这里插入图片描述

#将数据划分为训练集和测试集
#并且按照2:8的比例进行划分
train_x,test_x,train_y,test_y=train_test_split(train,label,test_size=0.2,random_state=1)

把数据进行训练和预测

#训练回归模型
lr=LinearRegression()
lr.fit(train_x,train_y)

#训练完进行预测
test_y['pred']=lr.predict(test_x)
test_y

在这里插入图片描述

我们将完全平方误差作为评价指标（MAE）

from sklearn.metrics import mean_absolute_error
accs=mean_absolute_error(test_y['消费者信心指数'],test_y['pred'])
accs

在这里插入图片描述

#############################################################################################
@ 2020.01.13 木居居士的统计学小组第十三周打卡
@ 2020.02.09 补充打卡
参考 https://blog.csdn.net/Julysxl/article/details/104230101
安利公益监督学习组织 - 【公众号】数据科学家联盟
https://mp.weixin.qq.com/s/1WWmbLZucz9vIp-4tKKQ5Q
感谢木东大佬、饼干大佬、南头大佬、星空妹砸、Desitiny、 DD-Kylin的无私付出，抱拳ing~

笨鸟的GPS

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
统计学习第十三周-回归分析实践

学习内容汽车销量数据建模（汽车销量与什么因素有关？）暂未有很好的资料参考学习，下次继续补充完善#############################################################################################@ 2020.01.13 木居居士的统计学小组第十三周打卡安利公益监督学习组织 - 【公众号】数据...
复制链接

扫一扫

专栏目录