python-探索性数据分析-足球赛事数据集

这篇博客聚焦于使用Python进行探索性数据分析(EDA),研究足球赛事数据集中裁判给出红牌的可能因素,特别是是否与球员肤色有关。
摘要由CSDN通过智能技术生成

有趣的数据集,包含球员和裁判间的故事

任务

探索性数据分析(EDA),挑战的目标,这些裁判在给红牌的时候砸想的呢,会不会跟球员的肤色有关。

代码集

import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd
import os,sys
import missingno as msno
#读取压缩数据集并显示
df = pd.read_csv('redcard.csv.gz',compression='gzip')
print(df.shape)
print(df.head())
#查看属性指标相关统计
print(df.describe().T)
#查看属性的字段类型
print(df.dtypes)
#将所有的列名转换成list
all_columns = df.columns.tolist()
print(all_columns)
#查看运动员的平均身高或体重,两种不同求法,后者去除重复统计
print(df['height'].mean())
print(np.mean(df.groupby('playerShort').height.mean()))

#groupby的案例分析举例
df2 = pd.DataFrame({
   'key1':['a','a','b','b','a'],
                    'key2'
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
你可以使用Python数据分析库来进行数据探索性分析和训练集-测试集的分割。常用的数据分析库包括NumPy、Pandas和Matplotlib。 首先,你需要导入这些库: ```python import numpy as np import pandas as pd import matplotlib.pyplot as plt ``` 然后,你可以使用Pandas库来加载和探索数据集。假设你的数据集是一个CSV文件,可以使用`read_csv`方法来加载数据: ```python data = pd.read_csv('your_dataset.csv') ``` 接下来,你可以使用Pandas提供的函数和方法来进行数据探索性分析,例如查看数据的前几行、统计摘要信息、查看缺失值等: ```python data.head() # 查看前几行数据 data.describe() # 统计摘要信息 data.isnull().sum() # 统计缺失值 ``` 在进行探索性分析时,你可以使用Matplotlib库绘制各种图形,例如直方图、散点图、箱线图等。下面是一个简单的示例: ```python plt.hist(data['column_name'], bins=10) # 绘制直方图 plt.scatter(data['x_column'], data['y_column']) # 绘制散点图 plt.boxplot(data['column_name']) # 绘制箱线图 plt.show() ``` 最后,你可以使用NumPy库的函数来将数据集分割为训练集和测试集。假设你想将数据集按照80%的比例划分为训练集,20%的比例划分为测试集: ```python from sklearn.model_selection import train_test_split X = data.drop('target_column', axis=1) # 特征数据 y = data['target_column'] # 目标数据 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) ``` 以上是利用Python进行数据探索性分析和训练集-测试集的分割的基本步骤。你可以根据具体情况进行更多的数据处理和分析操作。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值