【信息技术】【2016.07】基于视觉和遥感数据的多模式学习

在这里插入图片描述
本文为澳大利亚悉尼大学(作者:Dushyant Rao)的博士论文,共164页。

无人驾驶汽车通常被部署在未知的环境中执行探测和监测任务。在这种应用中,信息丰富性和不同传感器模式的获取成本之间往往存在折衷。视觉数据的信息通常非常丰富,但需要用机器人进行现场采集。相反,遥感数据的覆盖范围更大,可能在执行任务之前就可以获得。为了有效和高效地探索、监测环境,充分利用机器人所能获得的所有感知信息至关重要。一个重要的应用是使用自主式水下机器人(AUV)测量海底数据。AUV可以拍摄高分辨率的海底原位照片,这些照片可以用来将不同的区域划分为不同的栖息地类别,总结观察到的物理和生物特性,这就是所谓的底栖动物栖息地测绘。然而,由于水下机器人只能对海底的一小部分区域进行成像,因此通常使用从舰载多波束声纳获得的遥感测深(海洋深度)数据进行栖息地测绘。

随着近年来无监督特征学习和深度学习技术的迅猛发展,许多已有的技术研究了多模态学习的概念:捕捉不同传感器模式之间的关系,以执行分类和其他推理任务。本文提出了基于视觉和遥感数据的相关技术,并将其应用于AUV自主探测和监测任务中。这样做可以更准确地分类海底环境,也有助于自主调查规划。本文的第一个贡献是将无监督特征学习技术应用于海洋数据,将所提出的技术分别用于从图像和水深数据中提取特征,并将其性能与传统的传感器模态特征进行比较。第二个贡献是开发了一个多模式学习体系架构,捕捉了两种模式之间的关系。该模型对缺失模式具有很强的鲁棒性,这意味着在只有水深测量可用时,它可以为大型底栖动物栖息地测绘提取更好的特征。该模型使用各种模式组合执行分类,表明多模态学习相对基准案例提供了很大的性能改进。第三个贡献是使用门控特征学习模型扩展了标准学习体系架构,使模型能够更好地捕获视觉数据和水深数据之间的“一对多”关系。这就进一步扩展了推理功能,能够从水深数据中预测视觉特征,从而允许基于图像的查询。这样的查询对于AUV测量规划非常有用,特别是在没有监督标签的情况下。本文的最后一个贡献是提出了一些信息论方法来辅助测量规划。根据预期的额外视觉信息量,采用拟议措施预测未观察区域的效用。因此能够在一个大的区域内绘制实用地图,AUV可以利用这些地图从一组候选任务中确定信息最丰富的位置。通过对实际海洋数据的大量实验,验证了本文提出的模型的正确性。此外,所介绍的技术在机器人学的其他领域也有应用。因此,本文最后讨论了这些贡献的更广泛含义,以及由此产生的未来研究方向。

Autonomous vehicles are often deployed toperform exploration and monitoring missions in unseen environments. In suchapplications, there is often a compromise between the information richness andthe acquisition cost of different sensor modalities. Visual data is usuallyvery information-rich, but requires in-situ acquisition with the robot. Incontrast, remotely sensed data has a larger range and footprint, and may beavailable prior to a mission. In order to effectively and efficiently exploreand monitor the environment, it is critical to make use of all of the sensoryinformation available to the robot. One important application is the use of anAutonomous Underwater Vehicle (AUV) to survey the ocean floor. AUVs can takehigh resolution in-situ photographs of the sea floor, which can be used toclassify different regions into various habitat classes that summarise theobserved physical and biological properties. This is known as benthic habitatmapping. However, since AUVs can only image a tiny fraction of the ocean floor,habitat mapping is usually performed with remotely sensed bathymetry (oceandepth) data, obtained from shipborne multibeam sonar. With the recent surge inunsupervised feature learning and deep learning techniques, a number ofprevious techniques have investigated the concept of multimodal learning:capturing the relationship between different sensor modalities in order toperform classification and other inference tasks. This thesis proposes relatedtechniques for visual and remotely sensed data, applied to the task ofautonomous exploration and monitoring with an AUV. Doing so enables moreaccurate classification of the benthic environment, and also assists autonomoussurvey planning. The first contribution of this thesis is to apply unsupervisedfeature learning techniques to marine data. The proposed techniques are used toextract features from image and bathymetric data separately, and theperformance is compared to that with more traditionally used features for eachsensor modality. The second contribution is the development of a multimodallearning architecture that captures the relationship between the twomodalities. The model is robust to missing modalities, which means it canextract better features for large-scale benthic habitat mapping, where onlybathymetry is available. The model is used to perform classification withvarious combinations of modalities, demonstrating that multimodal learningprovides a large performance improvement over the baseline case. The thirdcontribution is an extension of the standard learning architecture using agated feature learning model, which enables the model to better capture the‘oneto-many’ relationship between visual and bathymetric data. This opens upfurther inference capabilities, with the ability to predict visual featuresfrom bathymetric data, which allows image-based queries. Such queries are usefulfor AUV survey planning, especially when supervised labels are unavailable. Thefinal contribution is the novel derivation of a number of information-theoreticmeasures to aid survey planning. The proposed measures predict the utility ofunobserved areas, in terms of the amount of expected additional visualinformation. As such, they are able to produce utility maps over a large regionthat can be used by the AUV to determine the most informative locations from aset of candidate missions. The models proposed in this thesis are validatedthrough extensive experiments on real marine data. Furthermore, the introducedtechniques have applications in various other areas within robotics. As such,this thesis concludes with a discussion on the broader implications of thesecontributions, and the future research directions that arise as a result ofthis work.

  1. 引言
  2. 项目背景
  3. 基于海洋数据的学习特征
  4. 基于视觉和水深特征的多模式学习
  5. 基于门控模型的扩展多模式学习
  6. 用于AUV调查规划的信息论度量
  7. 结论

更多精彩文章请关注公众号:在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Go语言(也称为Golang)是由Google开发的一种静态强类型、编译型的编程语言。它旨在成为一门简单、高效、安全和并发的编程语言,特别适用于构建高性能的服务器和分布式系统。以下是Go语言的一些主要特点和优势: 简洁性:Go语言的语法简单直观,易于学习和使用。它避免了复杂的语法特性,如继承、重载等,转而采用组合和接口来实现代码的复用和扩展。 高性能:Go语言具有出色的性能,可以媲美C和C++。它使用静态类型系统和编译型语言的优势,能够生成高效的机器码。 并发性:Go语言内置了对并发的支持,通过轻量级的goroutine和channel机制,可以轻松实现并发编程。这使得Go语言在构建高性能的服务器和分布式系统时具有天然的优势。 安全性:Go语言具有强大的类型系统和内存管理机制,能够减少运行时错误和内存泄漏等问题。它还支持编译时检查,可以在编译阶段就发现潜在的问题。 标准库:Go语言的标准库非常丰富,包含了大量的实用功能和工具,如网络编程、文件操作、加密解密等。这使得开发者可以更加专注于业务逻辑的实现,而无需花费太多时间在底层功能的实现上。 跨平台:Go语言支持多种操作系统和平台,包括Windows、Linux、macOS等。它使用统一的构建系统(如Go Modules),可以轻松地跨平台编译和运行代码。 开源和社区支持:Go语言是开源的,具有庞大的社区支持和丰富的资源。开发者可以通过社区获取帮助、分享经验和学习资料。 总之,Go语言是一种简单、高效、安全、并发的编程语言,特别适用于构建高性能的服务器和分布式系统。如果你正在寻找一种易于学习和使用的编程语言,并且需要处理大量的并发请求和数据,那么Go语言可能是一个不错的选择。
Go语言(也称为Golang)是由Google开发的一种静态强类型、编译型的编程语言。它旨在成为一门简单、高效、安全和并发的编程语言,特别适用于构建高性能的服务器和分布式系统。以下是Go语言的一些主要特点和优势: 简洁性:Go语言的语法简单直观,易于学习和使用。它避免了复杂的语法特性,如继承、重载等,转而采用组合和接口来实现代码的复用和扩展。 高性能:Go语言具有出色的性能,可以媲美C和C++。它使用静态类型系统和编译型语言的优势,能够生成高效的机器码。 并发性:Go语言内置了对并发的支持,通过轻量级的goroutine和channel机制,可以轻松实现并发编程。这使得Go语言在构建高性能的服务器和分布式系统时具有天然的优势。 安全性:Go语言具有强大的类型系统和内存管理机制,能够减少运行时错误和内存泄漏等问题。它还支持编译时检查,可以在编译阶段就发现潜在的问题。 标准库:Go语言的标准库非常丰富,包含了大量的实用功能和工具,如网络编程、文件操作、加密解密等。这使得开发者可以更加专注于业务逻辑的实现,而无需花费太多时间在底层功能的实现上。 跨平台:Go语言支持多种操作系统和平台,包括Windows、Linux、macOS等。它使用统一的构建系统(如Go Modules),可以轻松地跨平台编译和运行代码。 开源和社区支持:Go语言是开源的,具有庞大的社区支持和丰富的资源。开发者可以通过社区获取帮助、分享经验和学习资料。 总之,Go语言是一种简单、高效、安全、并发的编程语言,特别适用于构建高性能的服务器和分布式系统。如果你正在寻找一种易于学习和使用的编程语言,并且需要处理大量的并发请求和数据,那么Go语言可能是一个不错的选择。
Go语言(也称为Golang)是由Google开发的一种静态强类型、编译型的编程语言。它旨在成为一门简单、高效、安全和并发的编程语言,特别适用于构建高性能的服务器和分布式系统。以下是Go语言的一些主要特点和优势: 简洁性:Go语言的语法简单直观,易于学习和使用。它避免了复杂的语法特性,如继承、重载等,转而采用组合和接口来实现代码的复用和扩展。 高性能:Go语言具有出色的性能,可以媲美C和C++。它使用静态类型系统和编译型语言的优势,能够生成高效的机器码。 并发性:Go语言内置了对并发的支持,通过轻量级的goroutine和channel机制,可以轻松实现并发编程。这使得Go语言在构建高性能的服务器和分布式系统时具有天然的优势。 安全性:Go语言具有强大的类型系统和内存管理机制,能够减少运行时错误和内存泄漏等问题。它还支持编译时检查,可以在编译阶段就发现潜在的问题。 标准库:Go语言的标准库非常丰富,包含了大量的实用功能和工具,如网络编程、文件操作、加密解密等。这使得开发者可以更加专注于业务逻辑的实现,而无需花费太多时间在底层功能的实现上。 跨平台:Go语言支持多种操作系统和平台,包括Windows、Linux、macOS等。它使用统一的构建系统(如Go Modules),可以轻松地跨平台编译和运行代码。 开源和社区支持:Go语言是开源的,具有庞大的社区支持和丰富的资源。开发者可以通过社区获取帮助、分享经验和学习资料。 总之,Go语言是一种简单、高效、安全、并发的编程语言,特别适用于构建高性能的服务器和分布式系统。如果你正在寻找一种易于学习和使用的编程语言,并且需要处理大量的并发请求和数据,那么Go语言可能是一个不错的选择。
Go语言(也称为Golang)是由Google开发的一种静态强类型、编译型的编程语言。它旨在成为一门简单、高效、安全和并发的编程语言,特别适用于构建高性能的服务器和分布式系统。以下是Go语言的一些主要特点和优势: 简洁性:Go语言的语法简单直观,易于学习和使用。它避免了复杂的语法特性,如继承、重载等,转而采用组合和接口来实现代码的复用和扩展。 高性能:Go语言具有出色的性能,可以媲美C和C++。它使用静态类型系统和编译型语言的优势,能够生成高效的机器码。 并发性:Go语言内置了对并发的支持,通过轻量级的goroutine和channel机制,可以轻松实现并发编程。这使得Go语言在构建高性能的服务器和分布式系统时具有天然的优势。 安全性:Go语言具有强大的类型系统和内存管理机制,能够减少运行时错误和内存泄漏等问题。它还支持编译时检查,可以在编译阶段就发现潜在的问题。 标准库:Go语言的标准库非常丰富,包含了大量的实用功能和工具,如网络编程、文件操作、加密解密等。这使得开发者可以更加专注于业务逻辑的实现,而无需花费太多时间在底层功能的实现上。 跨平台:Go语言支持多种操作系统和平台,包括Windows、Linux、macOS等。它使用统一的构建系统(如Go Modules),可以轻松地跨平台编译和运行代码。 开源和社区支持:Go语言是开源的,具有庞大的社区支持和丰富的资源。开发者可以通过社区获取帮助、分享经验和学习资料。 总之,Go语言是一种简单、高效、安全、并发的编程语言,特别适用于构建高性能的服务器和分布式系统。如果你正在寻找一种易于学习和使用的编程语言,并且需要处理大量的并发请求和数据,那么Go语言可能是一个不错的选择。
Go语言(也称为Golang)是由Google开发的一种静态强类型、编译型的编程语言。它旨在成为一门简单、高效、安全和并发的编程语言,特别适用于构建高性能的服务器和分布式系统。以下是Go语言的一些主要特点和优势: 简洁性:Go语言的语法简单直观,易于学习和使用。它避免了复杂的语法特性,如继承、重载等,转而采用组合和接口来实现代码的复用和扩展。 高性能:Go语言具有出色的性能,可以媲美C和C++。它使用静态类型系统和编译型语言的优势,能够生成高效的机器码。 并发性:Go语言内置了对并发的支持,通过轻量级的goroutine和channel机制,可以轻松实现并发编程。这使得Go语言在构建高性能的服务器和分布式系统时具有天然的优势。 安全性:Go语言具有强大的类型系统和内存管理机制,能够减少运行时错误和内存泄漏等问题。它还支持编译时检查,可以在编译阶段就发现潜在的问题。 标准库:Go语言的标准库非常丰富,包含了大量的实用功能和工具,如网络编程、文件操作、加密解密等。这使得开发者可以更加专注于业务逻辑的实现,而无需花费太多时间在底层功能的实现上。 跨平台:Go语言支持多种操作系统和平台,包括Windows、Linux、macOS等。它使用统一的构建系统(如Go Modules),可以轻松地跨平台编译和运行代码。 开源和社区支持:Go语言是开源的,具有庞大的社区支持和丰富的资源。开发者可以通过社区获取帮助、分享经验和学习资料。 总之,Go语言是一种简单、高效、安全、并发的编程语言,特别适用于构建高性能的服务器和分布式系统。如果你正在寻找一种易于学习和使用的编程语言,并且需要处理大量的并发请求和数据,那么Go语言可能是一个不错的选择。
Go语言(也称为Golang)是由Google开发的一种静态强类型、编译型的编程语言。它旨在成为一门简单、高效、安全和并发的编程语言,特别适用于构建高性能的服务器和分布式系统。以下是Go语言的一些主要特点和优势: 简洁性:Go语言的语法简单直观,易于学习和使用。它避免了复杂的语法特性,如继承、重载等,转而采用组合和接口来实现代码的复用和扩展。 高性能:Go语言具有出色的性能,可以媲美C和C++。它使用静态类型系统和编译型语言的优势,能够生成高效的机器码。 并发性:Go语言内置了对并发的支持,通过轻量级的goroutine和channel机制,可以轻松实现并发编程。这使得Go语言在构建高性能的服务器和分布式系统时具有天然的优势。 安全性:Go语言具有强大的类型系统和内存管理机制,能够减少运行时错误和内存泄漏等问题。它还支持编译时检查,可以在编译阶段就发现潜在的问题。 标准库:Go语言的标准库非常丰富,包含了大量的实用功能和工具,如网络编程、文件操作、加密解密等。这使得开发者可以更加专注于业务逻辑的实现,而无需花费太多时间在底层功能的实现上。 跨平台:Go语言支持多种操作系统和平台,包括Windows、Linux、macOS等。它使用统一的构建系统(如Go Modules),可以轻松地跨平台编译和运行代码。 开源和社区支持:Go语言是开源的,具有庞大的社区支持和丰富的资源。开发者可以通过社区获取帮助、分享经验和学习资料。 总之,Go语言是一种简单、高效、安全、并发的编程语言,特别适用于构建高性能的服务器和分布式系统。如果你正在寻找一种易于学习和使用的编程语言,并且需要处理大量的并发请求和数据,那么Go语言可能是一个不错的选择。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值