pandas常用数据分析语法(三):查询

pandas常用数据分析语法(三):查询

#列的频率统计
df_2018['Area ID'].value_counts().head(1).values[0]

筛选某些值

#相同
ChargeGroups_selected = ['Vehicle Theft', 'Robbery', 'Burglary', 'Receive Stolen Property']
#包含
df_6 = df_6.loc[df_6['Address'].str.contains('PICO')]

df_2018[df_2018['Charge Group Description'].isin(ChargeGroups_selected)]

#排除
df_4 = df_4[~df_4['Charge Group Description'].isin(excluded)]

#在范围内
df_6 = df_6.loc[(df_6['Lon']<right1)&(df_6['Lon']>left1)]

分位数

Age.quantile(0.95)

排序

z_scores.abs().sort_values(ascending = False)

分组

df_4.groupby('Charge Group Description')['Age'].mean()

最大最小

op.idxmax()
op.max()
#位置
loca1 = df_6[df_6['Lat']==df_6['Lat'].max()].Location.head(1).values[0]

分列

mp = loca.split(',')
lon = float(mp[0][1:])
lat = float(mp[1][:-1])

df_6['Lon'] = df_6['Location'].str.split(',').str[0].str[1:]

apply

df_5.loc[:,'Location'] = df_5.loc[:,'Location'].apply(within_2km,args=(center,))

数据格式

df_6['Lon'] = df_6['Lon'].astype('float')

df_8['Arrest Date'].astype('str').str.split('-').str[0]

loc

df_8.loc[df_8.loc[:,'Arrest Type Code']=='F']

对bool用sum

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值