提取数据_数据提取、分类汇总

一、loc、iloc筛选器进行数据提取

  • loc按照数据表的索引标签进行提取

数据表的标签分行标签和列标签,这里讨论的是二维数据表。除列标签筛选之外还可以使用boolean array进行筛选

5326b9d1c775e3a32a551622a8a4ecf8.png

提取id为1004的学生分数

0a270a0875d7c529c658735a3211813b.png

提取id在1004之前的学生姓名和分数

55313dced25e8dfc0958830959142ff9.png

根据bool类型的数组进行提取

85f73e06ab2c7936d627c545875316fc.png
  • iloc按位置进行提取

按位置区域提取

4d05ca896fee2fb0c9fdd4100085d214.png

按位置逐条提取数据

9f10c755f779a03ceb6dcc2d85ce932a.png

根据bool类型的数组进行提取

a9b1dcff54c32a8256a591fa9db4666f.png

备注:从0.20.0开始,.ix索引器已弃用,所以就没有必要再介绍。继续使用会有警告提示,Warning: Starting in 0.20.0, the .ix indexer is deprecated, in favor of the more strict .iloc and .loc indexers。弃用的原因,官方文档已经解释了,就是如果轴是基于整数的,只支持基于标签的访问,而不支持位置访问。因此,在这种情况下,显式地使用.iloc或.loc通常更好。However, when an axis is integer based, ONLY label based access and not positional access is supported. Thus, in such cases, it’s usually better to be explicit and use .iloc or .loc

二、按照条件进行数据提取

条件提取,无非是加入一些限制条件筛选数据,常用的就是与、或、非、大于、小于、等于

python中与&,或|,非!=,等于==,大于>,小于<

筛选score大于70,sex为男的数据,并降序排列

c4c8cd71a6eefdd2dc42ed876f6d0b94.png

三、数据汇总

  • Groupby分类汇总

按照性别进行分类,并求平均值

6c7ab055ccbb969c890a9fea2aa4f0ef.png

按照班级、性别分类,并求平均值

c8181b7a2f38734ae90ff50099503ca4.png

按班级、性别分类,求学生人数和平均分数

d64c76dbb585fa1c3d020d12e80a519f.png
  • Pivot_table数据透视

数据透视表本质上还是数据分类汇总,只不过相比groupby功能更强大一点。Excel的数据透视表功能,大家可能比较熟悉,可视化的界面很友好,其实python同样也可以实现数据透视表的功能。

比如我们还是要实现班级、性别分类,计算学生人数和分数的平均值,可以用下面的代码实现

74cd35f7438ca4626335a1be140c44c6.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值