数据来源:https://www.kaggle.com/c/kobe-bryant-shot-selection/data
参考:https://blog.csdn.net/qq_41888542/article/details/80390900
1.导包
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from pylab import mpl
2.读取文件
#设置字体 mpl.rcParams['font.sans-serif'] = ['SimHei'] #读取csv文件 data=pd.read_csv("data.csv") #输出前5条数据 print(data.head()) #将shot_made_flag为空的数据清除 new_data = data[data['shot_made_flag'].notnull()]
可以看到 文件中的数据是 [5 rows x 25 columns]
action_type 进攻方式(更具体)
combined_shot_type 进攻方式
game_event_id 比赛时间id
game_id 比赛ID
lat 投篮点
loc_x 投篮点
loc_y 投篮点
lon 投篮点
minutes_remaining 单节剩余时间(分钟)
period 表示第几节
playoffs 是否是季后赛
season 赛季
seconds_remaining 剩余时间(秒)
shot_distance 投篮距离
shot_made_flag 是否进球
shot_type 两分球或三分球
shot_zone_area 投篮区域
shot_zone_basic 投篮区域(更具体)
shot_zone_range 投篮范围
team_id 球队ID
team_name 球队名称
game_date 比赛日期
matchup 比赛双方
opponent 对手
shot_id 投篮ID
3.数据可视化
先来看一看科比的投篮位置,可以很明显的看到3分线
plt.figure(figsize=(10,20)