【ML】多元线性回归

最新推荐文章于 2024-01-09 13:48:26 发布

水清_木秀

最新推荐文章于 2024-01-09 13:48:26 发布

阅读量989

点赞数

分类专栏：机器学习ML 文章标签： python 机器学习数据处理

本文链接：https://blog.csdn.net/WiKi_Su/article/details/78425765

版权

要操作的元数据：
链接:http://pan.baidu.com/s/1c2plP1Q
密码:n6qp

我们的目标是得到：各个指标中哪些指标和和营业额的关系最大。

数据处理之Forward Elimination实战

==================================================

Python

一些以前操作的说明，不再过多解释。
传送门：http://blog.csdn.net/wiki_su/article/details/78414169

选择好目标文件：

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

#import dataset
dataset = pd.read_csv('50_Startups.csv')
X = dataset.iloc[:,:-1].values
Y = dataset.iloc[:,4].values

上面看到对于地区State，我们需要做一些数据规范化的处理

#数据规范化
#第4列的城市数据需要规范化 （index = 3）
from sklearn.preprocessing import LabelEncoder,OneHotEncoder

labelencoder_X = LabelEncoder()
X[:,3] = labelencoder_X.fit_transform(X[:,3])

onehotencoder = OneHotEncoder(categorical_features = [3])
X = onehotencoder.fit_transform(X).toarray()

#避免虚拟数据的陷阱

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

水清_木秀

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【ML】多元线性回归

要操作的元数据：链接:http://pan.baidu.com/s/1c2plP1Q 密码:n6qp我们的目标是得到：各个指标中哪些指标和和营业额的关系最大。==================================================Python一些以前操作的说明，不再过多解释。传送门：http://www.jianshu.com/p/faab4ec7c549选择好
复制链接

扫一扫