AugGAN: Cross Domain Adaptation withGAN-based Data Augmentation 閱讀筆記

摘要

在模型訓練中,適當的數據增強能夠提升預測表現,因此是非常有必要的, 然而這種做法通常是使用一些有限的圖像處理基於原始資料來產生更多不同的 資料,而生成對抗網路(GAN)的出現使得我們能夠有更多的選擇。儘管如此,但 碰上較大規模或複雜的轉換時,像是使圖片從白天到夜晚的轉換等等,因此,本 篇論文提出基於 GAN 延伸的數據增強器 AugGAN,能夠將道路行駛的圖片根據 需求轉換同時保留更多的原本的細節。 這篇論文主要有三個貢獻: 1. 提供一種能夠感知結構的圖像轉換網路:網路能夠學習潛在數據轉換, 能將不同 domain 的圖像轉換並可減少轉換後圖像中的噪點等影響,提 高圖像轉換的品質。 2. 證明了檢測器並不受限於訓練資料的 domain。 3. 在比較難以檢測的夜間場景下,檢測性能大幅提升。

Introduction

高級駕駛輔助系統(ADAS)和自動駕駛車輛中最關鍵的功能是車輛檢測, 目前絕大部分的檢測系統都是設計於白天使用,當然我們會期望 ADAS 無論在 白天或夜晚都能準確的檢測車輛,但事實上這是非常困難的,因為車輛在白天和 夜晚外觀差異非常大,除了車輛顏色、距離等因素,還必須要考慮到遮擋、燈光 問題等,造成車輛特徵不太容易辨識。儘管 R-CNN、YOLO 的出現帶來了一些 突破,但是效果還是有限,此外,在公開的資料集中含有車輛的資料集大多都是 白天的場景,真實駕駛場景中的夜間車輛資料集非常少見。 直到最近,生成對抗網路(GAN)的出現,使得將資料集從白天轉換成夜晚的 圖片變得不是幻想,但是要直接套用還是會出現一些瑕疵,因此本文基於 GAN 提出了 AugGAN,一種結構感知的非成對圖像到圖像的轉換網路,能將現有的資 料集轉換至其他 domain,可直接用於目標檢測的訓練。由於從白天轉換至夜晚 的圖像是最困難的轉換之一,因此本文特別強調其重要性,但他們的方法也適用 於其他 domain 的轉換。

Proposed Framework

為了將圖片正確的轉換同時將物件良好的保留,本文假定編碼須包含原始與 轉換後的 domain 風格資訊以及輸入的圖片資訊結構。 上圖為本文提出的網路架構,X,Y 代表兩種圖像的 domain,X^,Y^分別代表 對應的切割遮罩,Z 代表編碼後的特徵空間,架構含有兩個 encoders EX,EY,兩 個 image-translation generators GX,GY,兩個 parsing nets PX,PY,兩個 discriminators DX,DY,此網路會同時於正向及反向循環中學習圖像翻譯以及分割子任務。

結論

在本文中,作者提出了 AugGAN,一種無配對式圖片轉換網路,用於駕駛時 物件偵測訓練圖片轉換,透過更佳的圖片物件保留做到能夠打敗其他方法,實現 更高的夜間車輛檢測準確度。此外,公共資料集中大多數的白天車輛資料集也因 為可透過 AugGAN 轉換為更真實的夜間資料集而提升價值,可用於夜間車輛檢 測的開發。除了將圖片做晝夜轉換外,AugGAN 還可提供更多不同的 domain 轉 換,如虛擬-虛擬、虛擬-現實、現實-現實、現實-虛擬等。

无监督的多源域自适应是指在没有访问源数据的情况下进行的域自适应方法。为了解释这一概念,首先需要了解两个关键术语的含义:域自适应和多源。 域自适应是指在机器学习和数据挖掘中,将模型从一个域(即数据的分布)迁移到另一个域的过程。域自适应的目标是使模型在目标域上具有更好的性能,而不需要重新训练或收集目标域的数据。 多源是指使用来自多个源领域的数据来进行域自适应。这种情况下,我们有多个源域的数据,但没有目标域的数据。这可能是因为目标域的数据很难收集、昂贵或没有权限访问。 在无监督的多源域自适应中,我们试图使用多个源域的数据来进行迁移学习,从而在没有目标域数据的情况下提高目标域上的性能。这个问题是非常具有挑战性的,因为我们没有标签的目标域数据来指导模型的训练。 一种常见的方法是使用领域间的分布差异来进行特征学习。例如,可以使用深度神经网络来学习源域和目标域之间的有用特征。通过最小化源域和目标域之间的距离,我们可以使网络学习到一组在多个域上通用的特征表示。 另一个方法是使用领域适应的损失函数。这种损失函数通过最大化源域和目标域之间的相似性,或最小化它们之间的差异,来迫使模型在目标域上有更好的性能。 总的来说,无监督的多源域自适应是一种在没有目标域数据的情况下使用多个源域数据进行迁移学习的方法。它可以通过学习通用特征或使用领域适应的损失函数来提高目标域上的性能。这种方法对于许多现实世界的情况是非常有用的,例如在医疗图像诊断和自然语言处理等领域中。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值