数据科学比赛汇总kaggle阿里天池等以及一般流程分享

2 篇文章 0 订阅
1 篇文章 0 订阅

目前我了解到的数据科学比赛有如下:
kaggle
阿里天池
DataCastle
FlyAI
Datafountain
Biendata
AI Challanger
Kesci
JDATA
iFLYTEK
这些比赛一般都是给你数据集,大致流程为:
1.对数据进行一些数据预处理,特征工程
2.读取数据,然后可以看看数据是否读取成功
3.如果是使用的pytorch,要定义dataset与dataloader,这两个的区别是
Dataset就是通过单个样本索引
而dataloader可以通过一个batch来读取。

4.建立你的模型,使用一些预训练模型,还有比如自己搭一些卷积神经网络,对于图数据还可以构建图神经网络
5.建立迭代,前向传播,自动反向传播(如果要做预测,对于训练数据和测试数据分别做各自的迭代,不过测试数据集不需要反向传播)
6.submit或者predict得到准确率或者预测的结果

后面如果想到,还会不断对本文更新

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值