数据处理阶段(一)

本文在Ubuntu虚拟机的Jupyter环境中探讨了Pandas数据处理的两个方面:如何删除重复行以及如何进行元素映射。通过duplicated()函数检测并使用drop_duplicates()删除重复行,然后介绍了映射的三种操作,包括replace()函数替换元素,map()函数新建列,以及rename()函数替换索引。
摘要由CSDN通过智能技术生成
此代码是在ubuntu虚拟机下的jupyter下进行操作的
#导包
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
1、删除重复元素
使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每个元素对应一行,如果该行不是第一次出现,则元素为True
#检测是否重复
df=DataFrame({'color':['red','white','black','green'],
             'value':[2,3,7,5]})
df.duplicated()
0    False
1    False
2    False
3    False

dtype: bool
df.drop_duplicates()     #删除重复的列
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值