神经网络与深度学习4

whui000

已于 2023-04-16 09:54:54 修改

阅读量44

点赞数

文章标签：深度学习神经网络人工智能

于 2023-04-07 17:19:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/whui000/article/details/130014994

版权

1 YOLO网络

YOLO网络结构：

网络输入：YOLO v1在PASCAL VOC数据集上进行的训练，因此输入图片为 448 × 448 × 3。实际中如为其它尺寸，需要resize或切割成要求尺寸。

模型处理：7×7网格划分

网络输出：输出是一个7 × 7 × 30的张量。

如下图，每个框代表1个预测的bb，粗细代表不同的置信度，越粗得越高。

损失函数：算法将目标检测看成回归问题，所以采用的是均方差损失函数。但是对不同的部分采用了不同的权重值。损失函数包含五项，依次为边界框中心点的损失，边界框的宽度高度损失，置信度损失（包含物体），置信度损失（不包含物体），类别损失。

2 语义分割

定义：找到同一画面中的不同类型目标区域

与其他问题的区别：

实例分割：同一类型目标要分出来具体实例（谁是谁）
目标检测：标出来外包围矩形

目标：对图中每一个像素进行分类，得到对应标签

基本思想：滑动窗口，问题：滑动次数太多，计算太慢，重复计算太多

如何解决？FCN

FCN网络结构：网络结构分为两个部分，分别是全卷积部分和反卷积部分。全卷积部分借用了一些经典的CNN网络，并把最后的全连接层换成卷积，用于提取特征，形成热点图；反卷积部分则是将小尺寸的热点图上采样得到原尺寸的语义分割图像。

FCN实现：卷积部分，反卷积部分（跳级结构）

语义分割关注如何将图像分割成属于不同语义类别的区域。

语义分割的一个重要数据集叫作Pascal VOC2012。

由于语义分割的输入图像和标签在像素上一一对应，所以将图像随机裁剪成固定尺寸而不是缩放。

3 循环神经网络与NLP

问题：文本识别

文本处理步骤：

文本切分
统计词频
独热编码

文本预处理步骤：

读取数据集
词汇切分
构建词索引表

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
神经网络与深度学习4

YOLO网络结构：网络输入：YOLO v1在PASCAL VOC数据集上进行的训练，因此输入图片为 448 × 448 × 3。实际中如为其它尺寸，需要resize或切割成要求尺寸。模型处理：7×7网格划分网络输出：输出是一个7 × 7 × 30的张量。如下图，每个框代表1个预测的bb，粗细代表不同的置信度，越粗得越高。损失函数：算法将目标检测看成回归问题，所以采用的是均方差损失函数。但是对不同的部分采用了不同的权重值。
复制链接

扫一扫

whui000 CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

170万+: 周排名

197万+: 总排名

345: 访问

: 等级

64: 积分

4: 粉丝

4: 获赞

2: 评论

3: 收藏

私信

关注

热门文章

最新评论

神经网络与深度学习4
CSDN-Ada助手: 非常感谢用户持续不断地分享关于神经网络与深度学习的知识，第四篇博客也是非常精彩。希望用户能够继续保持创作的热情，分享更多深入的知识和实践经验，让更多人从中受益。下一步可以考虑分享一些具体应用场景的案例分析，让读者更好地理解和应用神经网络与深度学习的技术。再次感谢用户的分享，期待更多精彩内容。 CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
神经网络与深度学习1
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。