用python做实验数据分析_Python小实验——利用Python进行NBA比赛数据分析

最新推荐文章于 2022-11-24 22:05:50 发布

涵之相约

最新推荐文章于 2022-11-24 22:05:50 发布

阅读量532

点赞数

文章标签：用python做实验数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30780735/article/details/113720990

版权

这篇博客介绍了如何运用Elo等级制度来预测比赛获胜概率，涉及数据来源、毕达哥拉斯定律的应用以及Python中处理数据的挑战。作者在尝试下载scipy库时遇到问题，最终通过安装特定版本解决。文章详细阐述了数据预处理步骤，包括数据读取、整合和创建训练样本，并强调了保证训练数据均衡的重要性。

摘要由CSDN通过智能技术生成

首先确定需要统计的数据，以及数据的来源。

通过毕达哥拉斯定律来进行估计：获胜的概率等于得分的平方除以(得分的平方加上机会得分的平方)

使用到了Elo等级划分制度，不懂就去百度

scipy 下载失败，百度了错误之后试着下载

scipy-0.15.1-win32-superpack-python2.7，最新版本为python3.4

后来发现是依赖包没有安装，但是没有办法直接下载依赖包，所以搜索scipy for win64-Python2.7，安装成功

首先插入实验相关模块，然后设置回归训练时所需用到的参数变量(当每支队伍没有elo等级分时，赋予其基础elo等级分)，在最开始需要初始化数据，从T、O和M表格中读入数据，去除一些无关数据并将这三个表格通过Team属性列进行连接(根据每支队伍的Miscellaneous Opponent，Team统计数据csv文件进行初始)

将胜利队伍和失败队伍的特征值随机分配到每场比赛数据的左右侧意思是，为了随机产生[winTeam, loseTeam](胜利队伍特征值在左侧，对应的y值标签为0)，[loseTeam, winTeam](失败队伍在左侧，对应的y值标签为1)这样的训练样本。你也可以固定利用数据集前一半为[winTeam, loseTeam]，后一半为[loseTeam, winTeam]这样来生成数据。只要保证两类数据的分布比较均衡，且在训练时随机得取到两类训练样本即可。

最后出现找不到模块的错误由朱老师接着完成

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。