pandas删除数据操作（空行，去重）

最新推荐文章于 2023-07-29 10:54:59 发布

YPL_ZML

最新推荐文章于 2023-07-29 10:54:59 发布

阅读量8.4k

点赞数 2

分类专栏：数据分析

本文链接：https://blog.csdn.net/YPL_ZML/article/details/93539894

版权

数据分析专栏收录该内容

35 篇文章 1 订阅

订阅专栏

import pandas as pd


# 加载数据
users = pd.read_excel('users.xlsx')
# print(users)

# 删除数据用drop
# labels 指定删除的列或者行名称
# axis = 0 删除行
# axis = 1 删除列
# inplace = True 替换原来数据
data = users.drop(labels=['age','sex'], axis=1, inplace=True)
print(users)

删除空值列

# 首先 整列为空，对于数据分析毫无意义

# pd.count()--->非空的数目

# drop -->删除空列

import pandas as pd


# 加载数据
detail = pd.read_excel('meal_order_detail.xlsx')
# print(detail.columns)
columns = detail.columns
# print(type(columns))
# for col in columns:
#     # print(col)
#     if (detail[col].count()) == 0:#全空列
#         print(col)
#         detail.drop(labels=col, axis=1, inplace=True)
# print(detail)


col = detail.count() == 0
# print(col)
length = len(col)

# print(length)
for i in range(length):
    if col[i]:
        detail.drop(labels=col.index[i],axis=1,inplace=True)

print("detail 的形状：",detail.shape)

#删除空列
#数据去重
#相似度运算



# 删除数据
# drop()
import pandas as pd


# 去重
# pd.drop_duplicates()

# 加载数据
detail = pd.read_excel('meal_order_detail.xlsx')

# 单列数据去重
# print(detail.columns)
# print(detail.shape)
# data = detail[['counts','amounts']].drop_duplicates()
# print(data.shape)

# 多列数据去重
data1 = detail.drop_duplicates(subset=['counts', 'amounts'], inplace=True)
print(data1.shape)

YPL_ZML

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
pandas删除数据操作（空行，去重）

import pandas as pd# 加载数据users = pd.read_excel('users.xlsx')# print(users)# 删除数据用drop# labels 指定删除的列或者行名称# axis = 0 删除行# axis = 1 删除列# inplace = True 替换原来数据data = users.drop(labels=['age',...
复制链接

扫一扫

专栏目录