和鲸社区 Numpy+Pandas数据处理·闯关2

Numpy+Pandas数据处理·闯关

关卡2

正常做法

前提(系统自带的)

df = pd.read_excel('/home/mw/input/pandas1206855/pandas120.xlsx')
df.head()
  1. 提取学历为本科,工资在25k-35k的数据
df1 = df[(df['education'] == '本科')&(df['salary'] == '25k-35k')]
  1. 提取salary列中以’40k’结尾的数据
df2 = df[df['salary'].str.endswith('40k')]
  1. 提取薪资区间中最低薪资与最高薪资的平均值大于30k的行,只需提取原始字段(‘createTime’, ‘education’, ‘salary’)即可
def func(df):
    lst = df['salary'].apply(lambda x:x.split('-')).tolist()
    return lst
lst = func(df)
aver_sala=[]
for i in range(len(lst)):
    num1 = int(lst[i][0].replace('k',''))
    num2 = int(lst[i][1].replace('k',''))
    aver_sala.append(float((num1+num2)/2))

df['aver_sala'] = aver_sala
df3 = df[df['aver_sala'] > 30][['createTime','education','salary',]]

不正常做法

等于正常做法

  • 6
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值