新方法:
用一个.loc也是可行的,连接的不是and ,是别的!!!!
去除的方法把不符合条件的变成None值,然后就可以了。
import pandas as pd
df = pd.DataFrame([1,2,3,4,5,6,3,2,1,3,4])
df.loc[ (df[0]>2) & (df[0]<5) ] =None #这里大于2小于5是我们要去除的条件,令这些为none值,然后#下面删除
print('df是',df)
z = df.dropna() #把定义成的none值删了
print('z是',z)
df是 0
0 1.0
1 2.0
2 NaN
3 NaN
4 5.0
5 6.0
6 NaN
7 2.0
8 1.0
9 NaN
10 NaN
z是 0
0 1.0
1 2.0
4 5.0
5 6.0
7 2.0
8 1.0
pandas的.loc并不支持 and这种组合,所以需要两次,即.loc.loc
例如
import pandas as pd
a = [1,2,3,4,5,6,7,78]
sdf = pd.DataFrame(a)
'''筛选出大于3小于6的行
'''
newdf = sdf.loc[sdf[0]>3].loc[sdf[0]<6]
如果写在一个里面,就会
import pandas as pd
a = [1,2,3,4,5,6,7,78]
sdf = pd.DataFrame(a)
'''筛选出大于3小于6的行
'''
newdf = sdf.loc[sdf[0]>3 and sdf[0]<6]
报错信息:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
对于日期判断也类似,需要两次loc操作