查的问题:
pandas的逻辑筛选功能还是蛮简洁流畅的,直接在方括号里输入逻辑运算符,即可进行
栏目筛选:
resultData[
resultData['true'] == False]
在名叫true的这一列查询等于False布尔值的行,即从600多万条里面筛选出“必输”状态的行,花费了:
0.170 sec
一开始我选择输入带引号的——'False' 结果给我显示查找出错。原来pandas自动把字符串转换成boolean类型了。所以直接用python的布尔变量就可以。
批量单元格对比逻辑运算:
df.
gt(df2)
df2.
ne(df)
查询中可能会用到的一些比较关键字:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
查找
全部满足括号内的
条件的列:
print (df > 0).all()
查找
部分满足括号内的
条件的列:
print (df > 0).any()
查询是否为空:
df.empty
相同值统计(直方图):
例如,随机生成1到7的10个数据:s = pd.Series(np.random.randint(0, 7, size=10))
s.value_counts()
然后统计重复的个数
df3 = df2.copy()
使用DataFrame里面的copy命