Pandas练习笔记2----------数据过滤与排序

1. 导库

import pandas as pd

2. 读取数据

euro12 = pd.read_csv(r'C:\pandas\pandas_exercise\exercise_data\Euro2012_stats.csv')

3. 只选取Goals这一列

euro12.Goals
# 或者 euro12['Goals']

结果:
在这里插入图片描述
4. 参与了2012欧洲杯的球队数

euro12.shape[0] # 16
# 或者 euro12.Team.nunique()
# 或者euro12['Team'].nunique()

5. 该数据集中一共有多少列

euro12.info()
# 或者 euro12.shape[1] 

结果:
在这里插入图片描述
6. 将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框

discipline = euro12[['Team','Yellow Cards','Red Cards']]
print(discipline)

结果:
在这里插入图片描述
7. 对数据框discipline按照先Red Cards再Yellow Cards进行排序

discipline.sort_values(['Red Cards','Yellow Cards'],ascending = False)

结果:
在这里插入图片描述
sort_values()函数使用方法:
DataFrame.sort_values(by=‘##’,axis=0,ascending=True, inplace=False, na_position=‘last’)
'by’是指定列名
'axis’为0是指按指定列中数据大小排列
ascending为True是指按升序排序,为False是指按降序排序
inplace是指替代原数据
na_position是指缺失值的显示位置

8. 计算每个球队拿到的黄牌数的平均值

round(discipline['Yellow Cards'].mean()) # 7

9. 找到进球数Goals超过6的球队数据

euro12[euro12.Goals > 6]

结果:
在这里插入图片描述

这属于pandas的DataFrame的布尔类型数据处理操作,是用来选择非索引列的值。

10.选取以字母G开头的球队数据

euro12[euro12.Team.str.startswith('G')]

结果:
在这里插入图片描述

startswith()函数是判断字符串是否以指定字符或字符串开头。
使用方法:Pandas.Series.str.startswith(self, pat, na=nan)
参数pat是指字符串;na为True是指object中没有字符串的话就不显示,反之为False
参考https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.startswith.html
返回值:布尔类型值
此处代码本质上等同于9处的代码

11. 选择前七列

euro12.iloc[:,0:7]

结果:
在这里插入图片描述
12. 找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)

euro12.loc[euro12.Team.isin(['England','Italy','Russia']),['Team','Shooting Accuracy']]

结果:
在这里插入图片描述
isin函数是判断该列中的元素是否在指定的列表中
isin函数返回值同样是布尔类型值
详情可参考:https://blog.csdn.net/lzw2016/article/details/80472649

区分iloc和loc的用法:
共同点:
iloc和loc都是用来对DataFrame数据进行切片处理
不同点:
iloc是用索引值定位处理
loc是用column名和index名定位处理

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值