24个终极数据科学项目(可免费获取资源)

数据科学项目为你在这个领域的深入研究提供了一个基础。通过实际应用,你不仅可以学习数据科学,也能够写在简历中提升你的资历在这上边花费的时间越多,你学到的知识就越多。

本文精选了24个数据科学项目,并囊括了各个领域和各种不同大小的数据集。另外,所有的数据集都是开源、可免费获取的。

171117588eed5cfb10de9a61c8679ef90508d709 

初级——这部分的数据集很容易处理,使用基础的回归/分类算法就可以处理这些数据集。并且,这些数据集有足够的教程供你学习。

中级——略微有点难度。包含了需要使用有点难度的模式识别技能来处理的大中型数据集。另外,特征工程在这里可以发挥作用了。

高级——包括神经网络、深度学习、推荐系统及高维数据等。

初级

1.Iris Data数据集(花的类别识别)

a7757ce811e789e37001a1fdeaee93a2b53f0744 

Iris Data Set可能是模式识别领域学习分类技术基本入门级的数据集,适合初学者该数据集里面包含了150行4列数据。

问题: 根据已有特征预测花的类别
资源:数据 教程

2.Loan Prediction 数据集(贷款预测)

7331cb081d795a1deb94607caaa55d1c42c83ee2 

是保险领域最常引用的一个数据集。利用这个数据集,你可以充分体验到如何处理保险公司的数据包括会遇到哪些挑战需要什么策略哪些变量会影响结果等。这是一个分类问题数据集包含615行13列个数据

问题: 预测一个贷款是否能够被批准。
资源:数据集 教程

3. Bigmart Sales 数据集(零售业销售)

2ca1bd545cf04494c12b40e3bb2f5236fd065153

零售业是另一个充分利用数据分析优化商业流程的行业。我们可以利用数据科学对商品的放置、库存管理、定制供应、商品捆绑等任务进行巧妙的处理该数据集包含了商店的交易数据,是一个回归问题,共包含8523行12列个数据。

原文链接

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值