在西瓜数据集上训练_数据标注是做什么的?

bd3d85205d68de8875c8d399a815df2a.png

想了解数据标注是做什么的,就要先了解人工智能的一些应用,在此可思数据以阿里巴巴的蜻蜓人脸识别系统为开端把想了解数据标注,这些基本概念都要了解下。而我们在做数据标注的时候,其产生的数据标注都是提供给客户,使其做机器学习过程中的模型和算法训练数据集而数据集又分为三类:

1.训练集 用来调试神经网络;

2.验证集 用来查看训练效果;

查看模型训练的效果,是否朝着坏的方向进行,及时停止训练

用在训练的过程中,几个epoch结束后就要跑一次验证集看看效果,及时发现模型或者参数的问题。如果模型设计不合理,训练的时候不容易发现,但是在验证集中可能会发散、mAP不增长或者增长很慢啦等等情况,这时可以及时终止训练,重新调参或者调整模型,而不需要等到训练结束,大大节省时间。另外一个好处是验证模型的泛化能力,如果在验证集上的效果比训练集上差很多,就该考虑模型是否过拟合了。同时,还可以通过验证集对比不同的模型。

3.测试集 用来测试网络的实际学习能力;

而我们在做人脸拉框或者其他的图片标注的时候,这些产生的数据,都会被用来做数据集来用,蜻蜓人脸识别系统,就是以此来进行调试,训练,以及验证的,使其在对你人脸识别的时候,知道你就是你,而不是别人。

当然图片标注只是其中一块,视屏标注的话,其实都差不多,都是靠图片一帧一帧的进行标注、

像语音标注的原理都差不多,不过涉及的方面也就更广一点,回头专门开个帖子来聊下。

以上由可思数据标注平台整理。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值