一、语义分割和FCN
定义:找到同一画面中的不同类型目标区域
区别于:
1.实例分割:同一类型目标要分出来具体实例
2.目标检测:标出来外包围矩形
1.1.基本思想
对图中每一个像素进行分类,得到对应标签
传统方法:滑动次数太多,计算太慢,重复计算太多
1.2.FCN网络
分为两个部分:全卷积部分和反卷积部分。全卷积部分借用了一些经典的CNN网络,并把最后的全连接层换成卷积,用于提取特征,形成热点图;反卷积部分则是将小尺寸的热点图上采样得到原尺寸的语义分割图像。
上池化(unpooling):池化逆运算,无信息部分用0填充。
FCN特点:
1.将传统CNN末端的全连接层改为卷积层:FCN中第6、7、8层都是通过1 × 1卷积得到的,第6层的输出是4096 × 7 × 7,第7层的输出是4096 × 7 × 7,第8层的输出是1000 × 7 × 7,即1000个大小是7 × 7的特征图(称为heatmap)。
FCN-8s
反卷积部分:跳级结构
1.3.评价指标
pixel accuracy:
mean accuracy:
mean IoU:
其中:
:类别i被识别成j的像素数
:类别个数,包含背景
:目标i的真实像素数
二、语言处理
2.1.数据处理
2.1.1.特征编码:略
2.1.2.文本处理
1.文本切分
2.统计词频
3.独热编码
2.2.文本预处理与词嵌入:略
2.3.RNN
特点,相比CNN的不同:
1、CNN空间扩展,神经元与特征卷积;RNN时间扩展,神经元与多个时间输出计算
2、RNN可以用于描述时间上连续状态的输出,有记忆功能,CNN用于静态输出