机器学习十大热文新鲜出炉，这个月你该读哪篇？

最新推荐文章于 2021-10-30 12:25:46 发布

AI科技大本营

最新推荐文章于 2021-10-30 12:25:46 发布

阅读量1.8k

点赞数 2

分类专栏： AI 人工智能

AI 同时被 2 个专栏收录

548 篇文章 25 订阅

订阅专栏

人工智能

543 篇文章 14 订阅

订阅专栏

翻译 | 林椿眄

编辑 | SuiSui

一直为开发者提供优质学习资源的Mybridge最近又发布了一篇资源性文章：《2018年2月机器学习10大热文精选》，这10篇文章是Mybridge是对近期发布的1400篇文章进行了排名并挑选出来的。为了让开发者对文章有更直观的了解，营长对这10篇资源进行了摘要式翻译。

以下文章讨论的话题主要包括：张量生成库，Deepfakes，神经网络，深度强化学习，语音，DMLab-30,医学图像分析，歌词分析，IRL等。

（此前营长发布过多篇收藏党喜欢的文章，也是来自Mybridge：①Python 开源项目 Top 10 精选，平均star为1128！ ②从1400篇机器学习文章中精选出Top 10，帮你找找上班的感觉！ ③ 从15000个Python开源项目中精选的Top30，Github平均star为3707，赶紧收藏！ ④我们从8800个机器学习开源项目中精选出Top30，推荐给你）

▌No.1 张量生成库（Tensor Comprehensions），由Facebook研究院提出。

Tensor Comprehensions是一个多功能的C++库，利用Halide、ISL、NVRTC和LLVM框架，它能够自动合成高性能的机器学习内核。此外，张量生成式库提供了底层接口，能够与Caffe2、PyTorch框架无缝衔接，实现很好的兼容性。更多关于该库的细节，我们将在论文中进行详细说明，论文已发表在arXiv上。

Tensor Comprehensions作为一种全新的机器学习框架，它具有高度的便携性，能够轻松地嵌入到其他设备上运行。不仅如此，它还兼具内存空间占用少，易分流，同步性好等优点，只需要一个简单的张量库就能满足需求。

github链接

▌No.2 如何利用deepfakes生成逼真的人脸照片。由 Sven Charleer提供。

Deepfakes是一个基于深度学习算法的应用程序，它能够自动学习如何构建人脸。给定一系列的人脸图片，经过数个小时，它就能够逼真地生成这些人脸图片。值得注意得是，它并不是简单地生成这些图片的副本，而是通过学习这些人脸各自的构造，不同的表情来生成相应的人脸。

原文参见

▌No.3 如何使用CoreML、PyTorch和React Naive框架在iOS系统中搭建神经网络。由Stefano J.Attardi提供

这篇文章我主要阐述如何在iOS系统中使用一个已训练好的神经网络来解决真实世界的问题。这些挑战在每个iOS应用程序中都会出现的。

下面，我将从问题入手详细说明每个问题的解决方案。首先，我们要逐步完成工具构建，数据集生成，神经网络模型的构建和在PyTorch上进行模型训练。进一步，我们还将在CoreML上进行模型转换，最终到达React Native UI。

原文参见

▌No.4 深度强化学习将不再有效。由Alexirpan提供

在过去几年里关于强化学习的研究，被引文章次数最多的高校或研究机构包括加州大学伯克利分校，Google Brain，DeepMind和OpenAI，我也是其中工作的参与者之一。这篇文章列举了多则关于深度强化学习弊端和局限性的内容。此外，在这份表单里我可能遗漏掉其他一些机构的研究成果，在此表示歉意。

原文参见

▌No.5 前端要完？人工智能已经能实现自动编写 HTML 和 CSS。由Emil Wallner提供。（中文版）

在未来三年内，深度学习将改变前端开发，它可以快速创建原型，并降低软件开发的门槛。

去年，该领域取得了突破性的进展，其中 Tony Beltramelli 发表了 pix2code 的论文[1]，而 Airbnb 则推出了sketch2code[2]。

目前，前端开发自动化的最大障碍是计算能力。但是，现在我们可以使用深度学习的算法，以及合成的训练数据，探索人工前端开发的自动化。

本文中，我们将展示如何训练神经网络，根据设计图编写基本的 HTML 和 CSS 代码。

原文参见

▌No.6 用生成对抗网络实现语音合成。由 Chris Donahue提供

虽然生成对抗网络(GAN)在图像合成问题上已经取得了广泛的成功，但还未在无监督式的音频生成领域中得到应用。

与图像不同的是，解决音频合成问题的一大障碍是区别不同音频之间的表示法往往是不可逆的，因此这种表示法不能用于合成音频输出。在本文中，我们介绍一种WaveGAN模型，这是第一次尝试在无监督的设置下将GAN应用于原始音频合成问题。实验结果表明，WaveGAN可以利用人类言语中的小词汇生成可理解的词汇，进一步地，这种方法对于其他领域的音频合成问题同样适用，例如鸟鸣，鼓声和钢琴声。

我们的研究还表明，WaveGAN模型是生成对抗网络在音频特征表示问题上成功的应用，这对于人类法官的案件审判有很大的帮助。关于模型的详细信息可参见我们这篇论文：https://arxiv.org/pdf/1802.04208.pdf