pandas删除数据操作(空行,去重)

import pandas as pd


# 加载数据
users = pd.read_excel('users.xlsx')
# print(users)

# 删除数据用drop
# labels 指定删除的列或者行名称
# axis = 0 删除行
# axis = 1 删除列
# inplace = True 替换原来数据
data = users.drop(labels=['age','sex'], axis=1, inplace=True)
print(users)

删除空值列

# 首先 整列为空,对于数据分析毫无意义

# pd.count()--->非空的数目

# drop -->删除空列

import pandas as pd


# 加载数据
detail = pd.read_excel('meal_order_detail.xlsx')
# print(detail.columns)
columns = detail.columns
# print(type(columns))
# for col in columns:
#     # print(col)
#     if (detail[col].count()) == 0:#全空列
#         print(col)
#         detail.drop(labels=col, axis=1, inplace=True)
# print(detail)


col = detail.count() == 0
# print(col)
length = len(col)

# print(length)
for i in range(length):
    if col[i]:
        detail.drop(labels=col.index[i],axis=1,inplace=True)

print("detail 的形状:",detail.shape)

#删除空列
#数据去重
#相似度运算



# 删除数据
# drop()
import pandas as pd


# 去重
# pd.drop_duplicates()

# 加载数据
detail = pd.read_excel('meal_order_detail.xlsx')

# 单列数据去重
# print(detail.columns)
# print(detail.shape)
# data = detail[['counts','amounts']].drop_duplicates()
# print(data.shape)

# 多列数据去重
data1 = detail.drop_duplicates(subset=['counts', 'amounts'], inplace=True)
print(data1.shape)
  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值