【人工智能与深度学习】监督方法的成功故事: 前置训练

最新推荐文章于 2024-07-18 18:43:19 发布

prince_zxill

最新推荐文章于 2024-07-18 18:43:19 发布

阅读量905

点赞数 6

分类专栏： Python实战教程人工智能与机器学习教程文章标签：人工智能深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61531676/article/details/128994318

版权

Python实战教程同时被 2 个专栏收录

104 篇文章 7 订阅 ¥29.90 ¥99.00

订阅专栏

人工智能与机器学习教程

74 篇文章 2 订阅 ¥29.90 ¥99.00

订阅专栏

【人工智能与深度学习】监督方法的成功故事: 前置训练

监督方法的成功故事: 前置训练

在上十年，一个用在许多不同的计算机视觉问题上的主要成功秘诀就是对ImageNet分类进行监督学习来学习视觉的「表示」。而且在没有大量标记了的数据时，使用这些学习到的表示，或模型中学习了东西的权重都作为其他计算机视觉任务的初始化部分，这都是成功秘诀之一。

相對地，取得ImageNet这样大小的数据集的注解是超花时间和昂贵。比如:ImageNet标记一千4百万张图就花了22年。

因为这样，社区就找下别的标记方法，比如社交媒体图片的主题标签(hashtags)，GPS位置，自我监督的方法，也就标签是数据样本本身的属性。

但更重要的问题就在别的标记法中出现了:

到底我们真正需要标记多少图片才够呢?

如果我们以物件类别分类和边界框式分类，那就有1百万张图片。
现在，如果边界框式分类的框被松开的话，那图片数量就跳跃到1400万(大约)。
相反，如果我们考虑用上互联网所有图像，就后方加多五个零吧。
而且，之后就要处理图片背后包含的数据，那就更要求其他感觉到这些的数据的输入来捕获或理解这些的数据。

**图 1:**注释可用数据的总额基础复杂度的变化

所以，以事实上ImageNet对图片的注释就花了22个人类年，那标签网上所有的图片就是不可行的。

稀有概念的问题 (长尾巴问题)

就是了，大

了解本专栏

关注

6
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
5
评论
【人工智能与深度学习】监督方法的成功故事: 前置训练

两种方法去定义自我监督学习基础监督学习的定义，即是这样，如果网路是以监督学习方式来运行，标签是以半自动方式来取得，而不是人类输入说出是什么标签的话。预测问题，也就是数据一部份是隐藏，而数据另一部份是可见。所以，目标就是去预测隐藏了或隐藏部份的属性。到底自我监督学习对于监督学习和无监督学习来说有什么不一样呢?监督学习的工作包括预先标签工作(而且一般都是人类提供的)，无监督学习就只有数据样本，而没有任何监督或标签﹑正确输出。
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

prince_zxill 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。