笔记:语义分割_FCN_RNN_NLP

一、语义分割和FCN

定义:找到同一画面中的不同类型目标区域

区别于:

1.实例分割:同一类型目标要分出来具体实例

2.目标检测:标出来外包围矩形

1.1.基本思想

对图中每一个像素进行分类,得到对应标签

传统方法:滑动次数太多,计算太慢,重复计算太多

1.2.FCN网络

分为两个部分:全卷积部分和反卷积部分。全卷积部分借用了一些经典的CNN网络,并把最后的全连接层换成卷积,用于提取特征,形成热点图;反卷积部分则是将小尺寸的热点图上采样得到原尺寸的语义分割图像。

上池化(unpooling):池化逆运算,无信息部分用0填充。

FCN特点:

1.将传统CNN末端的全连接层改为卷积层:FCN中第6、7、8层都是通过1 × 1卷积得到的,第6层的输出是4096 × 7 × 7,第7层的输出是4096 × 7 × 7,第8层的输出是1000 × 7 × 7,即1000个大小是7 × 7的特征图(称为heatmap)。

 FCN-8s

反卷积部分:跳级结构

1.3.评价指标

pixel accuracy:\sum_i \frac{n_{ii}}{t_i}

mean accuracy:\frac{1}{n_{cls}}\sum_{i}\frac{n_{ii}}{t_i}

mean IoU:\frac{1}{n_{cls}}\sum_i\frac{n_{ii}}{t_i+\sum_jn_{ji}-n_{ii}}

其中:

n_{ji}:类别i被识别成j的像素数

n_{cls}:类别个数,包含背景

t_i:目标i的真实像素数

二、语言处理

2.1.数据处理

2.1.1.特征编码:略

2.1.2.文本处理

1.文本切分

2.统计词频

3.独热编码

2.2.文本预处理与词嵌入:略

2.3.RNN

 特点,相比CNN的不同:

1、CNN空间扩展,神经元与特征卷积;RNN时间扩展,神经元与多个时间输出计算

2、RNN可以用于描述时间上连续状态的输出,有记忆功能,CNN用于静态输出

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值