3.Pandas数据预处理

本文介绍了使用Python的Pandas库进行数据预处理的方法,包括重新设置数据框索引、去除重复项、处理缺失值(查看、删除和填补)以及应用map函数进行数据转换。
摘要由CSDN通过智能技术生成

1.重新设置索引

#将month设置为列索引
df.set_index('month')   

2. 去重操作

df.drop_duplicates()   ##删除重复行,保留第一个
# 删除brand那一列的重复项
df.drop_duplicates(subset=['brand'])   # 默认保留第一个
# 保留最后一个
df.drop_duplicates(subset=['brand', 'style'], keep='last')  

3. 缺失值处理

3.1  查看缺失值状态

data.info

  3.2 删除缺失值

# 删除至少有一个缺失值的行
df.dropna() 
# 删除至少有一个缺失值的列
df.dropna(axis=1)
# 删除确实所有元素的行
df.dropna(how="all")
# 删除缺失两个及以下元素的行
df.dropna(thresh=2)

3.3 缺失值填补

 # 将所有NaN元素替换为0
df.fillna(0) 
 # 向前填充非空值
df.fillna(method="ffill")
#  向后填充非空值 
df.fillna(method="bfill")  
# 将时间这一列中所有的NaN替换为0,将指标这一列中所有的NaN替换为1
values = {"时间": 0, "指标": 1}
df.fillna(value=values)  

4. map的用法 

df = pd.DataFrame([[4, 9]] * 3,
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值