数据学习(十三)-回归分析实践

回归分析实践

导入包和读取数据

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

data=pd.read_csv("E:\data.csv")
data

结果如下:
在这里插入图片描述

#判断是否存在有特征值里面含有空值
data.isnull().any()

结果如下;
在这里插入图片描述

从上面可以看出特征值中,公路里程数存在空值。

#将特征中的空值用均值进行填充
data['公路里程数']=data['公路里程数'].fillna(data['公路里程数'].mean())

划分数据,将数据分为特征数据和标签数据。取特征数据中的有效数据特征。

label=data[['消费者信心指数']].copy()
train=data.iloc[:,2:]
train=train.drop(['消费者信心指数'],axis=1)
train

特征数据如下:
在这里插入图片描述

标签数据如下:
在这里插入图片描述

#将数据划分为训练集和测试集
#并且按照2:8的比例进行划分
train_x,test_x,train_y,test_y=train_test_split(train,label,test_size=0.2,random_state=1)

把数据进行训练和预测

#训练回归模型
lr=LinearRegression()
lr.fit(train_x,train_y)

#训练完进行预测
test_y['pred']=lr.predict(test_x)
test_y

预测结果如下:
在这里插入图片描述
我们将完全平方误差作为评价指标(MAE)

from sklearn.metrics import mean_absolute_error
accs=mean_absolute_error(test_y['消费者信心指数'],test_y['pred'])
accs

得到结果如下:
在这里插入图片描述
这是基本的回归分析的实践,后续可以从数据中挖掘有效的特征进行优化。然后我们也可以对数据进行处理然后看是否能优化。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值