数据集的读取

最新推荐文章于 2024-05-29 19:16:32 发布

shmilyam

最新推荐文章于 2024-05-29 19:16:32 发布

阅读量1.3k

点赞数

本文链接：https://blog.csdn.net/shmilyam/article/details/106670811

版权

建包：

import numpy as np
import pandas as pd

读取数据：

data = pd.read_csv(r'datingTestSet.csv',header=None)
data

效果展示：
在这里插入图片描述

data = pd.read_csv(r'datingTestSet.csv',header=None)
data.head(5)

效果展示：
在这里插入图片描述

data.tail()
data.sample()

以上两个代码都是输出信息，（）里可以有数字，
区别：
data.tail()是输出末尾5行
data.sample()是随机输出一行

data.drop('id',axis=1,inplace=True)

删除读取文件表头为“id”的那一列数据，并保证整个文件还是原来那个

data.duplicated().any()

是查看数据中是否有重复的值，如果有则输出true,反之false

data.drop_duplicated(inplace=True)

删除重复的数据

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注