【5问5答】带你探索性数据分析!

数据

假设我们的数据是这样的,无异常无缺失值,下面我通过几个问题,我们来练习用Pandas进行探索性数据分析~

yearnamesalarytitle
2001aa1500first
2002bb4300first
2003cc7000second
2001dd5000third

问题1: 最高薪水是多少?

我们将数据读取后命名为df

import pandas as pd
df['salary'].max()

同样的,最低(min)、平均(mean)。

问题2: bb的薪水是多少?

突然想到了SQL,是不是一句话的事情,select...from...where... 当然,我们的pandas也是一句话的事情:

df[df['name']=='bb']['salary']

问题3: 收入最高的人是谁?

那我们就定位到收入最高的行~

df[df['salary']==df['salary'].max()]
# or
df.loc[df['salary'].idxmax()]

问题4: 每年所有的员工平均收入?

是不是自然而然想到了分组,group by?

df.groupby('year').mean()['salary']

问题5: 有多少个职称?

这里使用nunique()函数,之前有一个小伙伴和我交流中就发现没有搞懂nunique()函数和unique()函数之间的区别,现在应该懂了吧?

df['title'].nunique()

总结

今天的分享就到这里啦,5个小问题掌握了嘛!数据分析的思维还是很重要的呢!

碎碎念:这种短文分享会不会更有效率些,让人不会有中途退出的冲动或者放在收藏夹里面吃灰哈哈。我个人是挺喜欢的,不知道你是不是一样。最近真是忙到爆炸,打完了第一针HPV9价,工作也还没找到,人生真是艰难,怎么办呢?既然上了生活的贼船,那就做个快乐的海盗吧(oo)

更多推荐

手把手|共享单车数据特征工程

SQL笔试 I 经典44题及答案解析~

干货 | 一文让你了解Pandas数据结构

长按二维码
关注我们吧

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值