探索2012欧洲杯数据
Euro2012_stats.csv
1.将数据集命名为euro12
import pandas as pd
import numpy as np
path = './data/Euro2012.csv'
# 将数据集命名为euro12
euro12 = pd.read_csv(path)
2.只选取 Goals 这一列]
# 只选取 Goals 这一列
euro12['Goals'].head()
3.有多少球队参与了2012欧洲杯?
# 有多少球队参与了2012欧洲杯?
len(np.unique(euro12['Team']))
4.该数据集中一共有多少列(columns)?
# 该数据集中一共有多少列(columns)?
len(euro12.columns)
5.将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框
# 将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框
discipline = euro12[['Team', 'Yellow Cards', 'Red Cards']]
discipline.head()
6.对数据框discipline按照先Red Cards再Yellow Cards进行排序
# 对数据框discipline按照先Red Cards再Yellow Cards进行排序
discipline.sort_values(['Red Cards', 'Yellow Cards'], ascending=False)
7.计算每个球队拿到的黄牌数的平均值
# 计算每个球队拿到的黄牌数的平均值
euro12['Yellow Cards'].mean()
8.找到进球数Goals超过6的球队数据
# 找到进球数Goals超过6的球队数据
euro12[euro12['Goals']>6]
9.选取以字母G开头的球队数据
# 选取以字母G开头的球队数据
euro12[euro12['Team'].str.startswith('G')]
10.选取前7列
# 选取前7列
euro12.iloc[:,:7]
11.选取除了最后3列之外的全部列
# 选取除了最后3列之外的全部列
euro12.iloc[:,:-3]
12.找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)
# 找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)
country = euro12['Team'].isin(['England', 'Italy', 'Russia'])
euro12[country][['Team', 'Shooting Accuracy']]