当NBA球星遇上机器学习……

最新推荐文章于 2023-01-17 12:11:46 发布

「已注销」

最新推荐文章于 2023-01-17 12:11:46 发布

阅读量3.1k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/duxinshuxiaobian/article/details/103146143

版权

640?wx_fmt=jpeg

全文共4423字，预计学习时长12分钟

640?wx_fmt=jpeg

来源：tuxi

我喜欢篮球。我喜欢打篮球、看篮球、谈篮球。有时候我会和朋友们谈论诸如“如果科比和勒布朗单挑谁会赢”之类的话题。我需要用这次机器学习项目，将我的两个爱好，篮球和数据科学有机地结合起来。

去年夏天，金州勇士队转出连续斩获两届NBA决赛MVP（最有价值球员奖）的凯文·杜兰特，引入德安格洛·拉塞尔。于是体育分析员纷纷开始猜测拉塞尔在勇士队的适配程度，如下：

640?wx_fmt=png

来源：clutchpoints

这也让我开始思考：德安格洛·拉塞尔将如何适应勇士队的节奏？能不能运用机器学习将NBA球员分类，并预测某一球员与指定球队的兼容程度？

本项目的研究目的是，确定若干球员的类型，并根据历史活动或他们对空间的利用确定他们在球场上扮演的角色。

得分、篮板、助攻、抢断、盖帽等数据不会被用作特征，因为它们依赖于例如出场时间或进球数量等数据（这项数据也不会出现在特征中）。将得分、篮板、助攻、抢断、盖帽等数据作为特征可能会使最终结果与这些特征密切相关，这就偏离了本次项目的初衷。我将在下文的研究方法部分详细列举所有的特征。

640?wx_fmt=jpeg

数据

我们来看一看数据部分。

数据是由Python和Selenium包从stats.nba.com 提取加工而成。选取的特征大部分都基于上场频率。很多打法都包含进攻和防守站位。比如说，“进攻背身单打率”指该球员背身单打时在进攻位的频率； “防守背身单打率” 指该球员背身单打时在防守位的频率。这些特征的附释，可以参考此链接：https://stats.nba.com/help/glossary/ 。

样本数据： 272名球员

初始数据集包含531名球员。而后上场时间少于半个赛季及1000分钟的球员被移出样本数据。这样做的原则是，去除所有出场不稳定的球员。以下是完整的球员样本名单：

640?wx_fmt=png

球员名单

选取特征： 41个

筛选之前特征总数超过600。最后选取了描述落位和运球的特征。

640?wx_fmt=png

特征列表

研究方法和模型选择

由于本项目属于无监督学习，它得出的结果需要进一步分析。我在模型和簇数选择上有两个目标：

1. 突出簇之间的显著差异。簇数太少，每个簇中样本太多，不能得出各个球员间的风格差异。

2. 避免簇数过多。如果每个球员都是一个簇，结果只能表明每一个人都是独立的个体，这对研究的帮助很小。

模型选择： DBSCAN, K-means和Mean Shift

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
当NBA球星遇上机器学习……

全文共4423字，预计学习时长12分钟来源：tuxi我喜欢篮球。我喜欢打篮球、看篮球、谈篮球。有时候我会和朋友们谈论诸如“如果科比和勒布朗单挑谁会赢”之类的话题。我需要用这次机器学习项目，将我的两个爱好，篮球和数据科学有机地结合起来。去年夏天，金州勇士队转出连续斩获两届NBA决赛MVP（最有价值球员奖）的凯文·杜兰特，引入德安格洛·拉塞尔。于是体育分析员纷纷开始猜测拉塞尔在勇士队的适配程度，如下...
复制链接

扫一扫

「已注销」 CSDN认证博客专家 CSDN认证企业博客

码龄5年

2070: 原创

-: 周排名

-: 总排名

339万+: 访问

: 等级

4万+: 积分

4917: 粉丝

4456: 获赞

1312: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

热点文章 552篇
AI 1079篇
热点文章 559篇
干货文章 39篇
热门文章 1篇
学术报告 11篇
干货文章 69篇
学术报告

最新评论

提前返回有好处吗？
温庭筠: 我不使用提前返回, 因为接手别人的代码时确实比较难理解一旦代码达到了维护阶段，新手程序员试图推理逻辑时，多次返回就会大大影响他们的效率（当注释比较分散，代码模糊不清时尤其糟糕）
在Windows系统和Linux系统中，如何打造一个好终端？
全栈小5: 文章结构严谨，每次阅读都能收获知识，感谢博主的分享，期待博主继续更新高质量文章，支持！【如何让windows终端和linux一样好用，博主这篇文章，值得一看】
NLP入门第一步：6种独特的数据标记方式
麦甜守望者: 有中文怎么标注的吗？
海量案例！生成对抗网络（GAN）的18个绝妙应用
PreWisdom: 18 Impressive Applications of Generative Adversarial Networks (GANs) by Jason Brownlee on July 12, 2019 in Generative Adversarial Networks https://machinelearningmastery.com/impressive-applications-of-generative-adversarial-networks/ 你知道我要说什么吧，你这完全是把别人的文章简单翻译了一下搬过来了，然后你发原创，真行啊
从零开始的人工智能和机器学习，该从哪里入手呢？
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/8023395, 请多输出高质量博客, 帮助更多的人

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。