源数据来自BasketballValue.com,All 2010-2011 playoffs data。
数据库设计
create table 2010NBAplayoffs (
gameID char(14),
period int,
time varchar(5),
homescore int,
awayscore int,
teamPoss char(3),
athome int,
playType varchar(12),
playDetail varchar(40),
player varchar(20),
opponent varchar(20),
teammate varchar(20),
stat int,
xcoord int,
ycoord int,
distance int)
处理txt文本,将PBP装载入数据库。
初步针对2011季后赛球队总数据作完整性检验(球队总数据正确,假定个人数据正确),
FG出手/命中、3p出手/命中、FT出手/命中、前/后场板、助攻、抢断、盖帽、犯规,总数皆正确。
PBP失误总数相比boxscore少1,由于没有统计每场的球队失误(team turnover,主要是24秒违例),也没有抓取个人单场数据记录,暂无法直接查出出错点。
注:直接统计PBP源文件中的个人犯规数(Foul,3535次),会出现总数不一致。原因是NBA官网playbyplay中,“Defense 3 Second”记作一次犯规(57次),按照比赛规则,防守3秒应该算做违例(Violation),而且还有双方个人犯规(Double Personal)(5次),3535-57+5 = 3483(boxscore个人犯规总数)。