Traffic thermal infrared texture generation based on siamese semantic CycleGAN基于孪生语义CycleGAN的交通热红外纹

Traffic thermal infrared texture generation based on siamese semantic CycleGAN

基于孪生语义CycleGAN的交通热红外纹理生成

作者:Peng Wang,Heng Sun,Xiangzhi Bai,Sheng Guo,Darui Jin

期刊:Infrared Physics & Technology(2021)

摘要

       热红外纹理生成是一种很有前途的红外成像框架,适用于各种应用。 针对热红外系统,提出了一种基于孪生语义 CycleGAN (SS-CycleGAN) 的新型热红外纹理生成算法。 与传统的红外仿真框架不同,SS-CycleGAN 不依赖于额外的环境信息,例如空气温度、湿度和物体的辐射特性。 换句话说,在通过训练 CNN 充分理解交通场景后,可见图像可以像使用风格转换算法一样直接转换为热红外图像。 在本文中,首先引入了风格迁移,用于从彩色可见图像生成热纹理。 设计并引入了用于可见红外变换的连体语义损失,以生成面向对象的热红外纹理,同时保持高清晰度。 与其他风格转换算法相比,SS-CycleGAN 可以在交通场景中生成具有清晰边缘细节的合理热红外纹理。

引言

       在智能交通系统中,热红外纹理显着提高了离线支持、模拟训练、交通监控和自动驾驶的效率。这是因为热纹理生成可以找到可见图像和热红外图像之间的内部关系,这对于交通场景很重要。例如,通过引入热纹理生成可以大大改善车辆检测。在可见图像中,机动车的召回率随涂装颜色的不同而不同。如图所示,尽管可见图像中的颜色和纹理各不相同,但大多数机动车都具有类似的热红外语义,具有深色外壳和明亮底盘。热红外图像中的这种显着性一致性有利于识别、分割和跟踪。借助热纹理生成,可以将交通场景图像转换为具有显着目标的热 红外图像,例如机动车辆和行人。这样,可见的交通场景图像可以更好基于显著目标红外纹理类内一致性去理解。

网络架构

       本文为了生成面向对象的热纹理 ,提出了一种基于CycleGan的新型风格迁移算法。

       孪生循环一致性语义网络(SSCycleGan)结构:

       支路①:输入可见光图像与G2生成的伪可见光图像建立循环一致性损失;

       支路②:输入红外图像与G1生成的伪红外图像建立循环一致性损失;

       两条支路的可见光图、红外图像的梯度分别构建对抗损失;两条支路的G1生成器通过Gram矩阵从生成特征图中生成强相关的纹理。

       两个生成器G1和G2构建风格转移损失。

孪生U-Net生成器:

       本文为了保持清晰度的同时生成纹理,对基于U-Net的生成器进行了修改,引入各种残差快来替换最大池化前的原始卷积块,提升深度串行网络的梯度传输效率,提高生成器的性能。将两个残差块最大池化特征图导出并转换为用于孪生语义损失计算的Gram矩阵,这些浅层特征表示面向对象的显著边缘和纹理,作为附加风格损失。

双鉴别器:

       为了获得高质量的热红外图像,在生成热纹理的同时应该保留彩色可将光图像的高清晰度,模糊部分应该被视为噪声,而不是红外风格。为了区分模糊和边缘细节,设计并引入了基于频率分析的双鉴别器。可以测量生成红外图像和参考红外图像的高频部分差异(边缘细节)。

       通过双鉴别器和红外图像梯度的GAN损失,可以测量频域中生成和参考热红外图像之间的差异。通过这种方式可以为交通场景的典型物体生成热红外纹理的同时识别边缘细节和模糊。

结果

创新点

       提出了一种基于CycleGAN  的新型风格迁移算法;

      设计并引入了基于频率分析的双鉴别器。

      文献阅读笔记的翻译是来自于: 学霸视界(xbsj.cool)推荐大家使用,可以免费翻译PDF!

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 单帧基于加权最小二乘的定格噪声修正是一种在未冷却的红外成像系统中的修正方法。该方法是为了解决红外成像中存在的定格噪声问题而提出的。 在红外成像过程中,由于系统自身的特点以及外部因素的干扰,成像结果中会存在一些无规律的噪声。这些噪声会干扰图像的质量,影响进一步的图像处理和分析。 该方法主要是通过对单帧图像进行修正来消除定格噪声。首先,利用最小二乘方法对图像中的定格噪声进行建模,并提取噪声分布的统计特征。然后,为了减少噪声对图像质量的影响,采用加权最小二乘算法来修正图像中的噪声。 加权最小二乘算法是一种通过给不同噪声像素赋予不同权重的方法来进行噪声修正。通常情况下,噪声像素的权重越低,修正后的图像质量也会越好。因此,在修正过程中,需要根据噪声像素的统计特征来确定噪声像素的权重。 通过将单帧图像进行加权最小二乘修正,可以有效地降低图像中的定格噪声水平,提高图像的质量和清晰度。这种修正方法在未冷却的红外成像系统中具有较好的实际应用价值,可以提高图像的可靠性和可视化效果。 ### 回答2: 无冷却红外成像系统中基于加权最小二乘的单帧列固定模式噪声校正,是一种用于去除图像中固定模式噪声的方法。 在无冷却红外成像系统中,由于传感器和电子组件的特性,图像可能存在固定模式噪声。这些噪声通常表现为能够在整个图像中看到的固定模式,比如亮点或者暗斑。 而单帧列固定模式噪声校正是一种基于一个图像帧进行噪声校正的技术。该方法通过对整个图像的每一列进行分析和处理来减少噪声的影响。 在校正过程中,首先采集一帧原始图像,并使用图像处理算法来检测和提取每一列的固定模式噪声。然后,根据噪声的特性和分布,使用加权最小二乘法对每一列的噪声进行建模和估计。 加权最小二乘法是一种通过最小化残差平方和来估计未知参数的方法。在这里,通过对每一列噪声的观测和预测值之间的差异进行优化,可以得到每一列的最佳权重。 最后,利用估计得到的权重对原始图像的每一列进行校正,即减去该列的固定模式噪声。通过这种方式,可以有效地降低图像中的固定模式噪声,并提高无冷却红外成像系统的图像质量。 总之,单帧列固定模式噪声校正是一种在无冷却红外成像系统中去除固定模式噪声的方法,它通过加权最小二乘法对每一列的噪声进行建模和估计,从而提高图像质量。 ### 回答3: 单帧基于加权最小二乘法的定型模式噪声校正在基于无冷却红外成像系统中的应用。 无冷却红外成像系统是一种常见的红外成像技术,用于检测辐射,并将其转化为可见的图像。然而,在这种系统中,由于长期使用和其他因素的影响,会导致一些固定的噪声模式出现在图像中,影响图像质量。因此,对这些固定的噪声模式进行校正是提高无冷却红外成像系统图像质量的重要一步。 单帧基于加权最小二乘法的定型模式噪声校正是一种常用的校正方法。它基于采集到的单帧图像,在不会损失太多图像细节的前提下,对图像中存在的定型模式噪声进行校正。在这个方法中,通过事先对不同噪声源的统计特性进行建模,以确定用于校正的权重参数。然后,使用加权最小二乘法来对图像中的噪声进行估计和校正。 在该方法中,首先需要获取一帧物体场景图像。然后,通过分析该图像中存在的定型模式噪声,可以得到各个噪声源的统计特性和权重参数。接下来,根据图像中的噪声模式,使用加权最小二乘法对图像中的噪声进行估计和校正。最后,通过应用校正后的图像,可以得到更准确和清晰的图像,提高无冷却红外成像系统的成像质量。 单帧基于加权最小二乘法的定型模式噪声校正方法具有简单、高效的特点,并且不需要额外的硬件设备。因此,这种方法在无冷却红外成像系统的实际应用中具有很高的实用性。通过对定型模式噪声进行校正,可以有效提升无冷却红外成像系统的成像质量,提高图像的细节还原能力和噪声抑制能力,为红外成像技术的发展提供了重要支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值