05-FCN的学习笔记
一、按照自己的观点,总结对于语义分割的理解
图像分割在深度学习方面有三个方向:
1.语义分割:将输入图片的各种类别用不同的颜色标记出来。此外,语义分割是 研究实例分割与全景分割的基础
2.实例分割:将输入图片的各种类别用不同的颜色标记出来,并且对同种类别也作区分,但不考虑背景
3.全景分割:在实例分割的基础上,将背景也考虑在内
如下图所示:
二、怎样理解论文中的Figure 2 ?
1 .该图能够让我们直观地理解分类网络的全连接层改为卷积层的过程
如下图所示:
三、用文字描述论文中的Figure 3
1 .图三为FCN的网络结构,FCN将VGG16改编成全卷积网络
2.该图共有5个pool层,每经过一层pool,输入图片的分辨率会降低原来的1/2
3.第5个pool层在经过卷积后会经过上采样(32倍)至原图大小;将conv7上采样2倍 + pool4 = a,再将a上采样(16倍)至元图大小;将conv7上采样4倍+将pool4上采样2倍 +pool3 =b ,再将b上采样(8倍)至原图大小。
如下图所示:
4.以张图片是对上面内容的补充
四、将论文Results中提到的前三个指标,用自己的理解描绘出来
1 .pixel accuracy(像素精度):所有预测正确的像素占所有像素的比例
2.mean accuracy(平均像素精度):所求得所有像素精度求平均
3.mean IU(平均交并比):混淆矩阵的对角线之和 / (混淆矩阵的行和+列和 -对角线之和)