Python机器学习:适合新手的8个项目

• 使用 Scikit-Learn 预测葡萄酒质量——训练机器学习模型的分步教程

• R: caret – 由 caret 包的作者提供的网络研讨会

数据源

• UCI 机器学习存储库 ——350 多个可搜索的数据集,涵盖几乎所有主题。您一定会找到您感兴趣的数据集。

• Kaggle 数据集——Kaggle 社区上传的 100 多个数据集。这里有一些非常有趣的数据集,包括 PokemonGo 产卵地点和圣地亚哥的墨西哥卷饼。

• data.gov ——美国政府发布的开放数据集。如果您对社会科学感兴趣,可以去看看。

2、玩钱球

在《点球成金》一书中 ,奥克兰 A 队通过分析球员球探彻底改变了棒球运动。他们建立了一支有竞争力的球队,而只花费了洋基队等大型市场球队支付薪水的 1/3。

首先,如果你还没有读过这本书,你应该去看看。这是我们的最爱之一!

幸运的是,体育界有大量数据可供使用。球队、比赛、比分和球员的数据都可以在线跟踪和免费获取。

对于初学者来说,有很多有趣的机器学习项目。例如,您可以尝试……

• 体育博彩……根据每场新比赛前的可用数据预测盒子得分。

• 人才球探…… 使用大学统计数据来预测哪些球员将拥有最好的职业生涯。

• 综合管理… 根据他们的优势创建球员集群,以建立一个全面的团队。

体育也是练习数据可视化和探索性分析的绝佳领域。你可以使用这些技能来帮助您决定要在分析中包含哪些类型的数据。

数据源

• 体育统计数据库 ——体育统计和历史数据,涵盖了许多职业运动和一些大学运动。干净的界面使网页抓取更容易。

• Sports Reference – 另一个体育统计数据库。界面更杂乱,但可以将单

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值