机器学习-Python实践Day2（数据准备--数据导入、理解、可视化）

最新推荐文章于 2023-03-22 09:30:59 发布

撸码小白

最新推荐文章于 2023-03-22 09:30:59 发布

阅读量461

点赞数

分类专栏：机器学习文章标签：机器学习 Python机器学习

本文链接：https://blog.csdn.net/qq_19950851/article/details/86303484

版权

本文介绍了机器学习中数据准备的重要步骤，包括通过Python标准库、Numpy和Pandas导入CSV文件，重点讲解了Pandas的使用。接着详细阐述了数据理解的多个方面，如查看数据、理解数据维度、数据类型、分布、统计分析和属性相关性。最后探讨了数据可视化，涉及单一图表如直方图、密度图和箱线图，以及多重图表如相关矩阵图和散点矩阵图，为机器学习提供数据基础。

摘要由CSDN通过智能技术生成

1.1、数据导入

机器学习的数据源通常都会以csv的格式来存储，因此在开始机器学习之前，需要先将数据导入到项目中，便于对数据进行后续操作。

有多种方法能对数据进行导入操作，我接下来将介绍常用的三种方法：

1.1.1、通过标准的Python库导入csv文件

from csv import reader
import numpy as np
# 使用标准的Python类库导入csv数据
filename='pima_data.csv'
with open(filename,'r') as raw_data:
    readers=reader(raw_data,delimiter=',')
    x=list(readers)
    data=np.array(x)
    print(data.shape)
    print(data)

在这里插入图片描述

1.1.2、通过Numpy导入csv文件

# 采用Numpy导入数据
import numpy as np
filename='pima_data.csv'
with open(filename,'r') as raw_data:
    data=np.loadtxt(raw_data,delimiter=',')
    print(data.shape)
    print(data)

在这里插入图片描述

1.1.3、通过Pandas导入csv文件

# 采用Pandas导入数据
import pandas as pd
filename='pima_data.csv'
df=pd.read_csv(filename,header=None)
print(df.shape)
print(np.array(df))

最低0.47元/天解锁文章

撸码小白

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
机器学习-Python实践Day2（数据准备--数据导入、理解、可视化）

1、数据操作（Pima Indians 印第安人医疗数据）1.1、数据导入方法1.1.1、通过标准的Python库导入csv文件1.1.2、通过Numpy导入csv文件1.1.3、通过Pandas导入csv文件1.2、数据理解1.2.1、简单查看数据1.2.2、数据维度1.2.3、数据类型和属性1.2.4、数据分类和分布情况1.2.5、描述性统计分析数据1.2.6、理解数据属性相关性1.2.7、...
复制链接

扫一扫