from pandas import Series,DataFrame
import pandas as pd
import numpy as np
from numpy import nan as NA
df = DataFrame(np.random.randn(7,3))
df.ix[:4,1] = NA
df.ix[:2,2] = NA
df
df.fillna(0) # 将缺失值填充为0
df.fillna({1:0.5,3:-1}) # 通过字典来调用fillna 实现对不同的列填充不同的值
# fillna会默认返回新的对象,但是也可以对现有的对象就地进行修改
_ = df.fillna(0,inplace=True)
df
df = DataFrame(np.random.randn(6,3))
df.ix[2:,1] = NA;df.ix[4:,2] = NA
df
df.fillna(method='ffill') # 对reindex有效的插值方法也可以用于fillna
df.fillna(method='ffill', limit=2) # 只填充第三列
data = Series([1,NA,3.5,NA,7])
data.fillna(data.mean())
# 层次化索引
data = Series(np.random.randn(10),
index=[['a','a','a','b','b','b','c','c','d','d'],
[1,2,3,1,2,3,1,2,2,3]])
data
'''
a 1 -1.455854
2 -0.847865
3 2.115079
b 1 -1.227672
2 0.35
利用Python数据分析:pandas入门(五)
最新推荐文章于 2022-12-06 20:16:38 发布