昨天,我们学习了pandas中的dropna方法,今天,学习一下fillna方法。该方法的主要作用是实现对NaN值的填充功能。该方法主要有3个参数,分别是:value,method,limit等。其余参数可以通过调用help函数获取信息。
(1)value
该参数主要是确定填充数值
>>> df = pd.read_excel(r'D:/myExcel/1.xlsx')
>>> df
name Chinese Chinese.1 id
0 bob 12.0 12 123.0
1 millor NaN 32 124.0
2 jiken 89.0 89 NaN
3 jiken 89.0 89 125.0
# 默认将所有值均填充为0
>>> df.fillna(0)
name Chinese Chinese.1 id
0 bob 12.0 12 123.0
1 millor 0.0 32 124.0
2 jiken 89.0 89 0.0
3 jiken 89.0 89 125.0
# 也可以通过字典控制每列传什么值
>>> my_dict = {'Chinese' : 92, 'id' : 98}
>>> df.fillna(my_dict)
name Chinese Chinese.1 id
0 bob 12.0 12 123.0
1 millor 92.0 32 124.0
2 jiken 89.0 89 98.0
3 jiken 89.0 89 125.0
2、method参数
该参数主要控制自动填充,是向上填充还是向下填充
method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}, default None
pad / ffill: 向下自动填充
backfill / bfill: 向上自动填充
# 向下
>>> df.fillna(method='ffill')
name Chinese Chinese.1 id
0 bob 12.0 12 123.0
1 millor 12.0 32 124.0
2 jiken 89.0 89 124.0
3 jiken 89.0 89 125.0
# 向上
>>> df.fillna(method='bfill')
name Chinese Chinese.1 id
0 bob 12.0 12 123.0
1 millor 89.0 32 124.0
2 jiken 89.0 89 125.0
3 jiken 89.0 89 125.0
3、limit参数
该参数类似于mysql中的limit。向上或者向下填充时控制最大填充前几行
# 限制自动填充最大填充1行。
>>> df.fillna(method = 'bfill', limit=1)
name Chinese Chinese.1 id
0 bob 12.0 12 123.0
1 millor 89.0 32 124.0
2 jiken 89.0 89 125.0
3 jiken 89.0 89 125.0
哈哈,以上就是关于fillna方法的介绍。
关于,isna方法很好理解,判断是否为NaN值
>>> df.isna()
name Chinese Chinese.1 id
0 False False False False
1 False True False False
2 False False False True
3 False False False False
>>>
哈哈,这就是今天的内容了。希望能帮助到大家。
如果有兴趣,可以关注我的公众号:python小工具。
让我们一起为提高办公的效率努力吧。