100天学习机器学习python代码计划-Day3：多值线性回归预测模型

最新推荐文章于 2023-04-15 15:23:31 发布

上进的小菜鸟

最新推荐文章于 2023-04-15 15:23:31 发布

阅读量334

点赞数

分类专栏：机器学习文章标签：机器学习线性回归预测模型 python pandas sklearn

本文链接：https://blog.csdn.net/qq_35153620/article/details/94488399

版权

本文是100天学习机器学习的Day3内容，主要探讨了多值线性回归预测模型。通过github上Avik-Jain的资源，学习了如何获取数据、进行预处理、编码、分割数据集，并使用Python的pandas和sklearn库创建、训练和测试线性回归模型。

摘要由CSDN通过智能技术生成

跟着github上的Avik-Jain学习机器学习：

https://github.com/Avik-Jain/100-Days-Of-ML-Code

Day3：多值线性回归预测模型

学习任务：

获取数据，对数据预处理(编码)，分割数据集

创建线性回归模型，学习并预测

1.数据处理

#imports library and read data
import pandas as pd
import numpy as np

#读取数据，并将数据分为样本和标签
data = pd.read_csv('G:/MachineLearningDailyStudy-100/100-Days-Of-ML-Code-master/datasets/50_Startups.csv')
x = data.iloc[:, :-1].values
y = data.iloc[:, 4].values

#对样本中的属性进行编码
#data preprocessing
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder = LabelEncoder()
x[:, 3] = labelencoder.fit_transform(x[:, 3])
on