条件查询
>>> df=pd.DataFrame(np.arange(12).reshape(3,4),columns=list('abcd'))
>>> df
a b c d
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
>>> df[['a','b']]
a b
0 0 1
1 4 5
2 8 9
>>> df[['a','b']][(df['c']> 5) & (df['d']>5)] #不要忘记()
a b
1 4 5
2 8 9
>>> df[['a','b']][~df['c']>5] #~非,取反
empty DataFrame
Columns: [a, b]
Index: []
>>> df['c'].between(2,5,inclusive=True) #inclusive:是否包含端点
0 True
1 False
2 False
Name: c, dtype: bool
>>> df['b'].isin([3,4,5,6]) # 是否在里面
0 False
1 True
2 False
Name: b, dtype: bool
增删
>>> df['e']=[1,2,3] #增加一列
>>> df
a b c d e
0 0 1 2 3 1
1 4 5 6 7 2
2 8 9 10 11 3
>>> df.insert(0,'e',df['a']) #增加一列(位置,列名,数据)
>>> df
e a b c d
0 0 0 1 2 3
1 4 4 5 6 7
2 8 8 9 10 11
>>> df.drop('e',axis=1) #只是一个视图,inpalce=True --直接取代
a b c d # 一次删除多个:['a','b']
0 0 1 2 3 #axis=0:按行的方向--删除index,axis=1 删除columns
1 4 5 6 7
2 8 9 10 11
>>> del df['e'] #直接作用df 一次删除多个:['a','b']
改:选出来重新赋值
>>> df.rename(columns={'d':'yi'},inplace=True) #修改column的值
>>> df
e a b c yi
1 0 0 1 2 3
2 4 4 5 6 7
3 8 8 9 10 11