用python做实验数据分析_Python小实验——利用Python进行NBA比赛数据分析

这篇博客介绍了如何运用Elo等级制度来预测比赛获胜概率,涉及数据来源、毕达哥拉斯定律的应用以及Python中处理数据的挑战。作者在尝试下载scipy库时遇到问题,最终通过安装特定版本解决。文章详细阐述了数据预处理步骤,包括数据读取、整合和创建训练样本,并强调了保证训练数据均衡的重要性。
摘要由CSDN通过智能技术生成

首先确定需要统计的数据,以及数据的来源。

通过毕达哥拉斯定律来进行估计:获胜的概率等于得分的平方除以(得分的平方加上机会得分的平方)

使用到了Elo等级划分制度,不懂就去百度

scipy 下载失败,百度了错误之后试着下载

scipy-0.15.1-win32-superpack-python2.7,最新版本为python3.4

后来发现是依赖包没有安装,但是没有办法直接下载依赖包,所以搜索scipy for win64-Python2.7,安装成功

首先插入实验相关模块,然后设置回归训练时所需用到的参数变量(当每支队伍没有elo等级分时,赋予其基础elo等级分),在最开始需要初始化数据,从T、O和M表格中读入数据,去除一些无关数据并将这三个表格通过Team属性列进行连接(根据每支队伍的Miscellaneous Opponent,Team统计数据csv文件进行初始)

将胜利队伍和失败队伍的特征值随机分配到每场比赛数据的左右侧意思是,为了随机产生[winTeam, loseTeam](胜利队伍特征值在左侧,对应的y值标签为0),[loseTeam, winTeam](失败队伍在左侧, 对应的y值标签为1)这样的训练样本。你也可以固定利用数据集前一半为[winTeam, loseTeam],后一半为[loseTeam, winTeam]这样来生成数据。只要保证两类数据的分布比较均衡,且在训练时随机得取到两类训练样本即可。

最后出现找不到模块的错误由朱老师接着完成

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值