Padas DataFrame添加、删除、异常数据处理操作

原始数据
在这里插入图片描述

增加、删除

添加一行

# 先创建一行的series数据
dic = {
    '名字':'复仇者联盟3',
    '投票人数':4565142,
    '类型':'剧情/科幻',
    '产地':'美国',
    '上映时间':'1994-09-10 10:00:00',
    '时长':154,
    '年代':1996,
    '评分':9.5,
    '首映地点':'美国'
}
s = pd.Series(dic)
s.name = 5

append()添加会返回新的DataFrame
在这里插入图片描述
删除一行,按索引删除,drop()同样也返回新的数据
在这里插入图片描述
添加一列,类似于字典添加键值对,DataFrame[新列索引] = 值
在原DataFrame的基础上添加的列
在这里插入图片描述
删除列,与删除行一样,但是要使用axis=1指定删除列,返回新的DatFrame
在这里插入图片描述

空值操作

添加一条带空值的数据
在这里插入图片描述
查找空值
找出时长为空的数据df2[df2['时长'].isnull()]
在这里插入图片描述

空值替换、填充

将平均值填充到空值的位置上

# 找出非空的时长求平均值
sa = df2[~df2['时长'].isnull()]['时长'].astype(int)
avg_time = np.mean(sa)
# 填充空值,inplace设置为True是在原来数据上操作
df2['时长'].fillna(avg_time, inplace=True)

在这里插入图片描述
在这里插入图片描述
对所有空值进行填充
先设置三个空值
在这里插入图片描述
填充 这里没有指定inplace则生成了新的DataFrame
在这里插入图片描述

删除缺失值

dropna()
参数:how=‘all’ 删除全为空值的行或列 how='any’删除存在空值的行或列
           subset 指定筛查空值的列
           inplace 是否在源数据上操作
           axis 选中行或列 默认为0,表示行
添加两条带nan值的数据
在这里插入图片描述
删除nan值所在的行
在这里插入图片描述

异常数据替换处理

使用replace()函数替换异常数据,替换结果生成新的dataFrame,原有数据不变,replace支持多种格式。
先创建一个DataFrame
在这里插入图片描述
将3替换成7
在这里插入图片描述
将5和6替换成7
在这里插入图片描述
将3换成6,5换成8
在这里插入图片描述
指定列操作
a列的5换成10
在这里插入图片描述
a列的1换成10,3换成9
在这里插入图片描述
a列的5和b列的3换成10
在这里插入图片描述
正则匹配替换
修改一下数据
在这里插入图片描述
以Li开头的替换成newLi
在这里插入图片描述
将以Be开头的换成newBe,Rose换成newRose
在这里插入图片描述
c列以Vi和Ch开头的换成new
在这里插入图片描述

推荐下一篇:DataFrame常用描述统计函数

  • 3
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值