机器学习-day1数据预处理

最新推荐文章于 2023-06-14 19:25:03 发布

Hannies今天也要加油鸭

最新推荐文章于 2023-06-14 19:25:03 发布

阅读量227

点赞数

分类专栏：机器学习与深度学习

本文链接：https://blog.csdn.net/weixin_44208433/article/details/104233071

版权

本文详细介绍了机器学习中的数据预处理过程，包括导入必要的库如NumPy和Pandas，数据集的导入，处理缺失数据，分类数据的解析，数据集的拆分以及特征缩放等关键步骤。通过这些预处理，可以提高模型的性能和准确性。

摘要由CSDN通过智能技术生成

数据预处理

在这里插入图片描述
第1步：导入需要的库。
NumPy：包含数学计算函数
Pandas：用于导入和管理数据集
这两个是我们每次都需要导入的库。

import numpy as np
import pandas as pd

第2步：导入数据集
数据集通常是.csv格式。csv文件以文本形式保存表格数据。文件的每一行是一条数据记录。
我们使用Pandas的read_csv方法读取本地csv文件为一个数据帧。然后，从数据帧中制作自变量和因变量的矩阵和向量。

dataset = pd.read_csv('../datasets/Data.csv/)
#不包括最后一行的所有咧
X = dataset.iloc[ : , :-1].values
#取最后一列
Y = dataset.iloc[ : , 3].values
print("Step 2: Importing dataset")
print("X")
print(X)
print(

最低0.47元/天解锁文章

Hannies今天也要加油鸭

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习-day1数据预处理

数据预处理第1步：导入需要的库。NumPy：包含数学计算函数Pandas：用于导入和管理数据集这两个是我们每次都需要导入的库。import numpy as npimport pandas as pd第2步：导入数据集数据集通常是.csv格式。csv文件以文本形式保存表格数据。文件的每一行是一条数据记录。我们使用Pandas的read_csv方法读取本地csv文件为一个数据帧...
复制链接

扫一扫