神经网络与深度学习4

1 YOLO网络

YOLO网络结构:

网络输入:YOLO v1在PASCAL VOC数据集上进行的训练,因此输入图片为 448 × 448 × 3。实际中如为其它尺寸,需要resize或切割成要求尺寸。

模型处理:7×7网格划分

网络输出:输出是一个7 × 7 × 30的张量。

如下图,每个框代表1个预测的bb,粗细代表不同的置信度,越粗得越高。

损失函数:算法将目标检测看成回归问题,所以采用的是均方差损失函数。但是对不同的部分采用了不同的权重值。损失函数包含五项,依次为边界框中心点的损失,边界框的宽度高度损失,置信度损失(包含物体),置信度损失(不包含物体),类别损失。

2 语义分割

定义:找到同一画面中的不同类型目标区域

与其他问题的区别:

  • 实例分割:同一类型目标要分出来具体实例(谁是谁)
  • 目标检测:标出来外包围矩形

目标:对图中每一个像素进行分类,得到对应标签

基本思想:滑动窗口,问题:滑动次数太多,计算太慢,重复计算太多

如何解决?FCN

FCN网络结构:网络结构分为两个部分,分别是全卷积部分和反卷积部分。全卷积部分借用了一些 经典的CNN网络,并把最后的全连接层换成卷积,用于提取特征,形成热点图;反卷积部分则是将小尺寸的热点图上采样得到原尺寸的语义分割图像。

FCN实现:卷积部分,反卷积部分(跳级结构)

语义分割关注如何将图像分割成属于不同语义类别的区域。

语义分割的一个重要数据集叫作Pascal VOC2012。

由于语义分割的输入图像和标签在像素上一一对应,所以将图像随机裁剪成固定尺寸而不是缩放。

​3 循环神经网络与NLP

问题:文本识别

文本处理步骤:

  • 文本切分
  • 统计词频
  • 独热编码

文本预处理步骤:

  • 读取数据集
  • 词汇切分
  • 构建词索引表
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值