深度学习这些“坑”你们有没有踩过（入门误区）

最新推荐文章于 2022-09-11 19:47:11 发布

计算机视觉研究院

最新推荐文章于 2022-09-11 19:47:11 发布

阅读量536

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gzq0723/article/details/89629273

版权

首先和大家说一声对不起，昨天由于平台安全问题，账号被黑入，发送了与本平台主旨背道而驰的内容，发现问题我们立马删除了，在此向大家说一声抱歉。

我们“计算机视觉战队”微信公众号，之后还会用心做我们该做的，希望没有给同学们带来困惑，也感谢大家长久以来的支持。

最近很多新入门的同学加入我们的大家庭，陆续加入到我们的学习群。如果你是入门及想提升自己的同学，我希望你可以考虑加入我们知识星球，我们定时会有详细的相关领域知识分解，并给出相应的动手实践，手把手带大家熟悉每个分支的具体实施过程，也给大家带来更多的动力及兴趣。

640?wx_fmt=jpeg

640?wx_fmt=gif

今天我们给大家带来一些基础性的理解，有兴趣的同学可以细读，慢慢体会其中的一些知识，希望给大家来来一些帮助。谢谢~

640?wx_fmt=gif

定位：深层学习在哪？

深层学习需要什么？

数学

线性代数：是有关任意维度空间下事物状态和状态变化的规则。

640?wx_fmt=jpeg

（推荐可以阅读这本书）

概率：是用来衡量我们对事物在跨时间后不同状态的确信度。

640?wx_fmt=jpeg

（推荐可以阅读这本书）

编程

640?wx_fmt=png

操作矩阵

实现数学想法

Python

等

640?wx_fmt=png

640?wx_fmt=gif

学习的难点

其实就是学习寻找关联函数f的过程。

难点：需要在未见过的任务上表现良好

有一种极端情况：

记忆：记住所有的训练样本和对应标签。

640?wx_fmt=png

640?wx_fmt=jpeg

实际：无法被穷尽，各式各样的变体。

640?wx_fmt=png

640?wx_fmt=png

关于函数f的寻找

640?wx_fmt=png

维度的问题

640?wx_fmt=png

维度越大，我们越无法获得所有的情况。

640?wx_fmt=png

面临没见过的情况，一般是将左右的情况平均一下。但是这种方法在高维数据下并不适用。

分布式表达

640?wx_fmt=png

原本需要8个不同情况，现在只需要6个。因为8个变体是有3种因素组合而成的。

数字表示法：解决变化的因素。

椭圆这个factor实际上也是有变体的，可以以相同的思路继续拆分，继续降低训练所需数据量。

No Free Lunch Theorem

640?wx_fmt=png

任何两个优化算法是等价的，当它们的性能是在所有可能的问题的平均值。

640?wx_fmt=gif

深度 VS 浅层

分布式表达是将变体拆分成因素。但是如果用无限节点的浅层网络，所拆分的变体并不会在不同样本之间形成共享。

而深层神经网络，由于拆分的变体可以在不同样本间共享，在浅层网络中只负责学习自己的关联，而在深层网络中，那些共用相同因素的样本也会被间接的训练到。换句话说，深层的优势在于节省了训练所需的数据量。

640?wx_fmt=png

关键：因素的共享

640?wx_fmt=gif

深层神经网络

学习的过程是因素间的关系的拆分，关系的拆分是信息的回卷，信息的回卷是变体的消除，变体的消除是不确定性的缩减。

640?wx_fmt=jpeg

自然界两个固有的先验知识：

并行：新状态是由若干旧状态并行组合形成。

迭代：新状态由已形成的状态再次迭代形成。

640?wx_fmt=gif

应用：如何设计网络

拆分因素：将变体拆分成因素，降低训练所需数据量。
因素共享：使所拆分的因素在不同的样本之间形成共享，可以用等量的数据训练出更好的模型。

640?wx_fmt=jpeg

每一层表示事物的一种状态，设计神经网络时，要以“层”为单元。

误区1：深层学习并非万能，应用先验知识的前提是数据可以以先验知识的方式生成
误区2：深层学习没有固定形式，可以依据上两个要点设计出各式各样的网络。

640?wx_fmt=gif

神经网络变体

循环层：时间共享

640?wx_fmt=png

如果用前馈层，每个圆圈表示100个节点，那么前馈层处理时序相关性时就需要学习300个权重。

但如果知道不同权重在时间下是共享的，那么就只需要学习200个权重。

卷积层：空间共享

640?wx_fmt=png

如果用前馈层，那么需要学习81个权重，但如果知道这些权重在空间下是共享的，那么可能只需要学习9个权重。原本一张图片在前馈层中只能用于学习一次权重，在卷基层中却可以学习很多次。

640?wx_fmt=gif

设计自己的神经网络

640?wx_fmt=png

两个方向相加的双向循环层一般比相并的效果好

神经网络其实并不黑箱，真正黑箱的是你的Task。
设计神经网络就是寻找在你手头的Task上利用因素拆分和因素共享的合理方式
可以先经过前馈层再经过双向循环层再经过前馈层最终得到你的结果。

640?wx_fmt=gif

案例

640?wx_fmt=png

640?wx_fmt=gif

某些技术

多任务学习muti-task learning，利用的是因素共享，多个任务共享相同的知识，这样就会更容易确定我们真正想要的关联f，而排除掉那些只符合训练数据集，而不符合测试数据集的关联。

joint learning，end-to-end learning，是因素共享+因素拆分的联合应用。通过缩减人工预处理和后续处理，尽可能使模型从原始输入到最终输出，给模型更多可以根据数据自动调节的空间，增加模型的整体契合度。

640?wx_fmt=gif

人工智能对我们的影响

640?wx_fmt=png

END

640?wx_fmt=png

计算机视觉战队

最优秀的AI团队

加入我们，一起学习，共同进步！

（向左滑动，有惊喜）

如果想加入我们“计算机视觉战队”，请扫二维码加入学习群。计算机视觉战队主要涉及机器学习、深度学习等领域，由来自于各校的硕博研究生组成的团队，主要致力于人脸检测、人脸识别，多目标检测、目标跟踪、图像分割等研究方向。

计算机视觉研究院

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习这些“坑”你们有没有踩过（入门误区）

首先和大家说一声对不起，昨天由于平台安全问题，账号被黑入，发送了与本平台主旨背道而驰的内容，发现问题我们立马删除了，在此向大家说一声抱歉。我们“计算机视觉战队”微信公众号...
复制链接

扫一扫

计算机视觉研究院

CSDN认证博客专家 CSDN认证企业博客

码龄12年

771: 原创

9736: 周排名

1500: 总排名

169万+: 访问

: 等级

1万+: 积分

5242: 粉丝

1246: 获赞

487: 评论

7364: 收藏

私信

关注

热门文章

分类专栏

深度学习付费 53篇
目标检测 2篇
图像处理 5篇
特征提取 2篇
数学 2篇
算法 5篇
caffe 2篇
源码 1篇
框架 1篇

最新评论

新目标检测框架 | 基于改进的one-shot的目标检测
我是一个对称矩阵: 您好，请问oneshot可以不给目标图像吗？正常推理时就是一个普通yolo检测，出现新目标时手动框选目标作为目标图像，后续推理自动识别这样的新目标
2PCNet：昼夜无监督域自适应目标检测（附原代码）
m0_46010301: 你好你复现成功了吗
AI部署以及工业落地学习之路（文章较长，建议收藏）
追风少年+1: 这篇文章干货满满，作者深入浅出地讲解了AI部署与工业落地的关键点，对AI部门成员和其他AI爱好者来说绝对是个宝典，收藏了！能感受到作者对AI领域深厚的理解和热情，佩服！PerfXCloud，一个免费使用大模型API的平台，不妨体验一下，说不定能让你的AI项目如虎添翼！
YoloV：视频中目标实时检测依然很棒（附源代码下载）
Mundane_World: 大佬，yolov5上可以用吗
YOLOv8 深度解析！一文看懂，快速上手实操（附实践代码）
2301_79744609: 博主，为啥有的环境要求python最小3.8呢，咱们这里3.7怎么理解，是代码不一样吗

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

计算机视觉研究院 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。