——python sql
pandas在数据处理上有着丰富且高效的函数,我们把数据清理、整理好后,只是一张原始的DataFrame。python也能像SQL一样或者excel里面的voolkup一样将数据进行合并,也能像excel里面的透视表或者sql group by一样进行数据透视组合,也能像excel的查找功能或者sql里面的where功能进行数据筛选。
文章目录
python类似sql where用法或excel查找用法
python 类似where用法中的 col=a、col<>a、col=a and col =b、col=a or col=b、col in(a,b,c)、col not in(a,b,c)
语法 | 描述 |
---|---|
df[‘col’]==‘Female’ | 查找df表col列中内容等于Female的内容= 用法 |
df[‘col’]!=11 | 查找df表col列中内容不等于11的内容<> 用法 |
df[df[‘col’]==‘Female’] | 查找df表中col列单个条件等于Female的内容,并返回整张表所有列 |
df[(df[‘col’]==‘Female’)&(df[‘col2’]>0)] | 查找df表中col列等于Female,并且col2列大于0的内容,返回整张表所有列 and 用法 |
df[‘col’].between(a,b) | col列中a=2,b=8,返回2-8之间的数 |
df[(df[‘col’]>=10)|(df[‘col2’]<50)] | 查找df表中col列小于等于10或者col2列小于50的内容,返回整张表所有列 or 用法 |
df[df[‘col’].isin([21.01, 23.68, 24.59])] | 查找col列中包含指定值的内容,返回整张表所有列in 用法 |
df[-df[‘col’].isin([11,63])] | 查找col列中不包含多个值的内容,返回整张表not in 用法 |
代码案例
import pandas as pd
data={
'a':[1,2,3,4,3,2,6],
'b':[43,23,52,23,11,63,83],
'c':['true','fales','true','true','fales','fales','true']}
data=pd.DataFrame(data)#创建一个df表
Out[33]:
a b c
0 1 43 true
1 2 23 fales
2 3 52 true
3 4