公车等候时间太长？机器学习帮你预测延迟 | 一周AI最火论文

本文链接：https://blog.csdn.net/BigDataDigest/article/details/95061179

大数据文摘专栏作品

作者：Christopher Dossman

编译：conrad、Jiaxu、云舟

呜啦啦啦啦啦啦啦大家好，本周的AI Scholar Weekly栏目又和大家见面啦！

AI ScholarWeekly是AI领域的学术专栏，致力于为你带来最新潮、最全面、最深度的AI学术概览，一网打尽每周AI学术的前沿资讯。

每周更新，做AI科研，每周从这一篇开始就够啦！

本周关键词：神经网络、机器人、文本分析

本周热门学术研究

HO-3D数据集发布，机器手逆

研究人员最近发布了HO-3D，这是一个大规模的数据集，具有不同的手持对象交互与手和对象姿态的三维注释。他们还介绍了基于数据集的高效注释和预测方法。

HO-3D基于全局优化，利用深度、颜色和时间约束来有效地注释序列，研究人员使用该方法训练了一种新的方法，用于从一张单色图像预测手部和物体的三维姿态。

HO-3D数据集由8个不同的人操作不同对象的RGB-D序列组成，并在视图中手工注释以评估3D姿态。

更多的高质量数据意味着模型会更准确，HO-3D对于开发高度鲁棒的模型具有重要作用，因为它能够帮助模型进行有效训练。这一数据集将鼓励研究人员开发更好的注释方法，可以被应用于单RGB-D摄像机捕获和序列注释，从而为改进手部和对象姿态估计提供额外的训练数据，激发出计算机视觉和机器人领域更有效的应用。

原文：

https://arxiv.org/abs/1907.01481

公交车等候时间太长？机器学习帮你预测延迟

谷歌地图为全球数百个城市的公交车提供了实时交通预测服务。为了建立这个模型，他们从公交站点接收到的公交位置序列中提取了训练数据，并将其与公交车行驶路线上的车速进行了比对。

为了捕捉特定街道、社区和城市的独特属性，谷歌让模型学习不同大小区域的表示层次结构，模型中使用时间轴单元的地理位置表示为其在不同尺度上的位置嵌入的总和。

该模型被分解为一系列时间轴单元，包括访问街道街区和每个对应于巴士时间轴的站点，每个单元预测持续时间。由于不频繁的采样，公共汽车的高速移动，以及某些较小的街区和车站，一对相邻的观测通常跨越许多单元。

该模型显著提高了全球数百万人的交通正时精度。考虑到数以百万计的人在城市旅行中依赖于乘坐公交车，该方法能够实现清晰的预测，使用户更容易规划他们的旅行。

原文：

https://ai.googleblog.com/2019/06/predicting-bus-delays-with-machine.html

Brno移动OCR数据集

捷克布尔诺理工大学的研究人员引入了移动OCR数据集(B-MOD)，用于从手持移动设备捕获的低质量图像中识别文档光学字符。

虽然OCR高质量的扫描文件是一个成熟的领域，目前已有很多可用的商业工具，并且网络上也有大型文本数据集的存在，却没有现有的数据集可以用来开发和测试对于非均匀照明，模糊图像，强噪生数据，内置去噪，锐化、压缩和其他出现在移动设备照片中的文档鲁棒的OCR方法。

该数据集包含了2000多页随机科学论文的独特页面，这些论文是由多人使用23种不同的移动设备拍摄的。最终得到了19728张各种视觉质量的照片，伴随着精确的位置和50万行的文本注释。它们进一步提供了一种评估方法，包括评估服务器和带有非公开注释的测

所提供的数据集将使未来开发和评估低质量图像的文档分析成为可能。它主要用于行级文本识别，并可进一步用于行定位、布局分析、图像恢复和文本二值化。

原文：

https://arxiv.org/abs/1907.01307v1

神经网络认证，AI、机器人研究生的福音

尽管有关AI应用的安全研究的数目日益增长，但目前针对的AI程序验证机制可用的工具、方法及教学材料仍显不足。

作为教学项目的一部分，Heriot-Watt 大学最近开设了LAIV实验室。LAIV，全称为人工智能及其验证实验室，招纳了大量人工智能和机器人专业研究生。研究人员目前就LAIV的成功和困境进行了总结，发现大部分为预料到的问题都是由现有的编程语言的局限性引起的。

随着人工智能应用的增加，AI社区如何武装自身，以解决当前面临的挑战，对未来的发展至关重要。

对于想要掌握轻量级神经网络验证的AI和机器学习从业者及学生，这项工作通过对编程语言及工具的空间设计，为AI的验证工作提供了未来的研究方向。

研究人员概述了AI和机器人学生目前可用的两种主要验证途径。一个是基于集成到Python中的自动化定理证明的想法。另一种是基于像Coq这样的ITP。这项工作表明，自动验证更符合验证单个网络的对抗性稳健性的想法，而交互式证明在很大程度上不能用于此目的，但更适合验证神经网络更一般的属性。

原文:

https://arxiv.org/abs/1907.01297v1

社会文化数据的文本分析

文本分析能否为人们提供关于重大事件的新视角？尽管人类读者在阅读过程中能够更好地进行逻辑推理，理解歧义并联系相关的文化知识，但有限的时间和精力限制了人类涉猎的广度。

最近发布的一项研究分享了一些计算机文本分析方面的经验。尽管本文所用的方法并不处于研究最前沿，却为一些棘手问题提供了解决方案。此外，该工作还分享了一些处理厚重的社会文化概念的实践经验。

计算文本分析为探索一些最紧迫的当代文化和社会问题提供了新的可能性。虽然这项工作是基于研究人员自己的经验，所以难免有局限性，但它提供了多种学科背景和研究的实践经验，可以促进跨学科合作。

对于激发计算文本分析在社会文化领域的潜力而言，跨学科的见解和合作非常重要。这项工作可以帮助研究人员更清楚、广泛地看到和探索关于文化和社会的微妙模式。

原文:

https://arxiv.org/abs/1907.01468v1

其他爆款论文

最新点云生成模型的优秀表现：

https://arxiv.org/abs/1906.12320v2

探索音频合成新手段，激发音乐创造力：

https://arxiv.org/abs/1907.00971v1

实时重定位性能的更优实现：

https://arxiv.org/abs/1810.12163v2

使用人工生成图片预测机器人关键点：

https://arxiv.org/abs/1907.01879

XNect帮助下的多人3D实时动态捕捉：

https://arxiv.org/abs/1907.00837

AI新闻

机器人过程自动化（RPA）是企业自动化的未来吗？

https://www.forbes.com/sites/jeanbaptiste/2019/07/03/why-softbank-invested-300-million-in-robotic-process-automation-rpa/#53c4c4377e6f

谷歌AI公布油管8M数据集：

https://ai.googleblog.com/2019/06/announcing-youtube-8m-segments-dataset.html

麻省理工学院开发了一种微型步进电机，可帮助复杂机器人自行组装：

https://techcrunch.com/2019/07/02/mit-develops-tiny-walking-motor-that-help-more-complex-robots-self-assemble/

专栏作者介绍

Christopher Dossman是Wonder Technologies的首席数据科学家，在北京生活5年。他是深度学习系统部署方面的专家，在开发新的AI产品方面拥有丰富的经验。除了卓越的工程经验，他还教授了1000名学生了解深度学习基础。

LinkedIn：

https：//www.linkedin.com/in/christopherdossman/