大写的吐槽:暑假提前结束,实验室项目越来越紧,略烦躁(不喜欢做的项目),没啥自由学习的时间了。只有抽些零散的时间去准备数据挖掘比赛相关的东西。最近关注的大神 wepon,bryan的博客,干货多多!
PS: 实验室师兄们找工作也是压力山大,祝他们好运!
今天继续pandas基础学习,参考资料还是来自以下网址,练习数据换成自己的,加深印象:
http://www.open-open.com/lib/view/open1402477162868.html
对象属性
首先导入pandas:
from pandas import Series,DataFrame
import pandas as pd
重新索引
Series 对象的重新索引通过其 .reindex(index=None,**kwargs)
方法实现。**kwargs
中常用的参数有俩:method=None,fill_value=np.NaN
:
ser = Series([4.5,7.2,-5.3,3.6],index=['d','b','a','c'])
>>> a = ['a','b','c','d','e']
>>> ser.reindex(a)
a -5.3
b 7.2
c 3.6
d 4.5
e NaN
dtype: float64
>>> ser.reindex(a,fill_value=0)
a -5.3
b 7.2
c 3.6
d 4.5
e 0.0
dtype: float64
>>> ser.reindex(a,method='ffill')
a -5.3
b 7.2
c 3.6
d 4.5
e 4.5
dtype: float64
>>> ser.reindex(a,fill_value=0,method='ffill')
a -5.3
b 7.2
c 3.6
d 4.5
e 4.5
dtype: float64
.reindex()
方法会返回一个新对象,其 index 严格遵循给出的参数,method:{'backfill', 'bfill', 'pad', 'ffill', None}
参数用于指定插值(填充)方式,当没有给出时,自动用 fill_value 填充,默认为 NaN(ffill = pad,bfill = back fill
,分别指插值时向前还是向后取值)
DataFrame 对象的重新索引方法为:.reindex(index=None,columns=None,kwargs)。仅比 Series 多了一个可选的 columns 参数,用于给列索引。用法与上例类似,只不过插值方法 method 参数只能应用于行,即轴 0。DataFrame 对象的重新索引方法为:.reindex(index=None,columns=None,kwargs)。仅比 Series 多了一个可选的 columns 参数,用于给列索引。用法与上例类似,只不过插值方法 method 参数只能应用于行,即轴 0。
>>> data