不可错过!2019 热门机器学习内容盘点

作者 | Derrick Mwiti

译者 | 刘畅

出品 | AI科技大本营(ID:rgznai100)

Facebook/CMU开发了首个在6人扑克中击败职业玩家的AI

根据该文章,Pluribus是第一款能够在六人无限注德州扑克中击败职业玩家的AI机器人。这是AI机器人第一次在超过两个玩家或两个团队的复杂游戏中击败顶级人类玩家

 

Pluribus经受了职业扑克玩家的测试。其中包括世界扑克系列大赛的两名获胜者。Pluribus使用self-play来教自己如何取胜。没有任何示例或者额外指导。Pluribus中使用的self-play版本是迭代蒙特卡洛CFR(MCCFR)算法的改进版本。

 

链接:

https://ai.facebook.com/blog/pluribus-first-ai-to-beat-pros-in-6-player-poker

 

权重不可知神经网络(Weight Agnostic Neural Networks)

 

这篇文章提出了一种神经网络结构的搜索方法,该方法可以在无需任何明确的权重训练下,完成某个任务。文章提到,会使用从均匀随机分布中采样的单个共享权重参数填充连接来评估这些网络。该方法能够找到最小的神经网络结构,该结构可以在无需权重共享下执行强化学习任务。

 

链接:https://weightagnostic.github.io/

 

基于点神经的图形

作者提出了一种基于点的方法来对复杂场景进行建模。它使用原点云来作为场景的几何表示。然后,它通过对局部几何形状和外观进行编码的可学习的神经描述来扩展每个点。

 

根据该文章:描述符与深度渲染网络是并行学习的,因此可以通过将来自新视角的点云进行栅格化,然后经过该网络来获取场景的新视图。栅格化的输入会将学习到的描述符用作点伪色(point pseudocolors)。

 

链接:https://arxiv.org/abs/1906.08240

进化算法如何训练能力更强的自动驾驶汽车

在达尔文进化论的启发下,Waymo和DeepMind的工程师着手进行了一项研究项目,旨在使神经网络的训练更加有效。他们设计了一种基于进化竞争自动确定超参数的方法,基于人口的训练(Population Based Training, PBT)。

 

对网络的评估是以进化的方式相互竞争,以求生存。一个性能较差的网络将被性能更佳的网络(后代)取代。后代是种群中表现最好成员的copy

链接:

https://deepmind.com/blog/article/how-evolutionary-selection-can-train-more-capable-self-driving-cars

Google Research Football简介:一种新的强化学习环境

Google Research Football是一种增强学习环境,它的目的是为了掌控足球。

链接:

https://ai.googleblog.com/2019/06/introducing-google-research-football.html

 

它提供了基于物理的3D足球模拟,控制者可以控制团队中的一名或所有足球运动员。他们学习如何在彼此之间传球,如何打破对手的防守去得分。

 

该足球模拟环境会提供:

  • 高度优化的游戏引擎

  • 一堆可以称为足球基准的研究问题

  • Football Academy,一组越来越困难的强化学习场景

 

Github地址:

https://github.com/google-research/football

paper地址:https://arxiv.org/abs/1907.11180

 

使用Python构建DAB和T姿态控制的灯光

 

本文将引导构建一个可以通过网络摄像头识别舞步的神经网络。作者使用OpenPose来检测身体位置。

 

链接:

https://www.makeartwithpython.com/blog/dab-and-tpose-controlled-lights

 

Uber借助机器学习在模拟市场中获得Insights

Uber市场模拟团队构建了一个模拟平台,该平台是一个具有骑手和驾驶员伙伴的模拟环境。该环境模仿了现实世界中的场景。它使用基于代理的离散事件模拟器。该平台使Uber Marketplace工程师和数据科学家能够在无风险的环境中快速原型化和测试新功能。

 

链接:

https://eng.uber.com/simulated-marketplace/

安全性之外的鲁棒性:ComputerVision应用程序

在这篇文章中,作者讨论了以下这篇计算机视觉论文:

论文地址:https://arxiv.org/abs/1906.09453

 

他们的假设是基本分类框架可用于解决具有挑战性的图像合成任务。作者开发的工具包可以对所有任务使用一个现成的分类器。该分类器经过训练后,可以具有强对抗性。

 

链接:http://gradientscience.org/robust_apps

github地址:

https://github.com/MadryLab/robustness_applications

使用Keras和深度学习进行视频分类

 

本文将教你如何使用Keras和Python进行视频分类。本文介绍了如何使用CNN进行视频分类。

 

链接:

https://www.pyimagesearch.com/2019/07/15/video-classification-with-keras-and-deep-learning

用于仿真说话的头部模型的few-shot对抗学习

本文提出了一个可创建个性化真实感谈话的头部模型。 其目的是在给定面部表情的情况下合成逼真的个性化头部图像

 

链接:https://arxiv.org/abs/1905.08233v1

Capture the Flag:复杂合作模型的出现

本文介绍了游戏中的强化学习。作者的最新论文展示了如何在Quake III Arena Capture the Flag中达到人类水平的表现。

链接:

https://science.sciencemag.org/content/364/6443/859.full?ijkey=rZC5DWj2KbwNk&keytype=ref&siteid=sci

作者使用锦标赛风格的评估方式来说明智能AI可以在三维多人第一人称视频游戏中达到人类水平。输入仅仅是像素和游戏分数。他们使用了一个两层优化过程。在随机生成的环境中,从数千次并行匹配中同时训练一群独立的强化学习智能体。每个智能体都会学习它自己内部的奖励信号和对世界的表征。

链接:

https://deepmind.com/blog/article/capture-the-flag-science

无需奖励工程的端到端的深度强化学习

本文讨论了一种端到端方法,该方法允许机器人从图像中学习,而这些图像说明了已经成功执行的特定任务。因此不需要手动奖励工程。

链接:

https://bair.berkeley.edu/blog/2019/05/28/end-to-end/

github地址:

https://github.com/avisingh599/reward-learning-rl

 

动态相机,动态的人:一种用于深度预测的深度学习方法

本文讨论了针对移动人员的深度预测。这是通过应用基于深度学习的方法完成的,该方法从人们自由移动的视频中生成深度图。该模型会学习人体姿势,因此不直接依赖于3D定位。

链接:

https://ai.googleblog.com/2019/05/moving-camera-moving-people-deep.html

 

CNN,第1部分:卷积神经网络简介

这是一个卷积神经网络(CNN)的简介,包括如何使用NumPy从头开始在Python中构建一个神经网络的介绍

链接:

https://victorzhou.com/blog/intro-to-cnns-part-1/

GitHub地址:

https://github.com/vzhou842/cnn-from-scratch/tree/forward-only

 

领先的监督学习,计算机视觉,自然语言处理方法,可确保我们的平台安全

 

本文介绍了Facebook如何提高其内容理解系统的准确性和效率,以及如何通过减少监督学习来实现更多目标。

链接:

https://ai.facebook.com/blog/advances-in-content-understanding-self-supervision-to-protect-people

本文突出的主要内容是:

  • 内容理解的自我监督的未来

  • 使用主题标签实现视频记录设置的准确性

  • 最新的照片和视频理解SOTA指标

  • 使用多语言的句子嵌入来处理有害的内容

 

解构彩票:Zeros,Signs and Supermask

作者提供了彩票假说论文的摘要以及他们自己的论文。他们的论文是基于原始的彩票假说论文。他们还解释了为什么原始论文中的模型会按其方式执行。

链接:

https://eng.uber.com/deconstructing-lottery-tickets/

 

使用Nvidia Jetson Nano和Python,仅以150美元的价格就可构建基于硬件的面部识别系统

根据该作者的介绍,借助Nvidia Jetson Nano,你可以构建独立的硬件系统,从而以很小的预算运行GPU加速的深度学习模型。它就像Raspberry Pi,但速度更快。

链接:

https://medium.com/@ageitgey/build-a-hardware-based-face-recognition-system-for-150-with-the-nvidia-jetson-nano-and-python-a25cb8c891fd

 

逻辑电路的模块化神经网络

本文介绍了使用具有梯度下降的神经网络来构建和训练逻辑电路。

链接:

https://www.declanoller.com/2019/05/24/descending-into-modular-neuroevolution-for-logic-circuits

GitHub地址:

https://github.com/declanoller/hyper_NE_GD

原文链接:

https://heartbeat.fritz.ai/2019s-top-machine-learning-articles-49082b4ca946

(*本文为AI科技大本营翻译文章,转载请微信联系 1092722531)

精彩推荐

2020年,由 CSDN 主办的「Python开发者日」活动(Python Day)正式启动。我们将与 PyCon 官方授权的 PyCon中国社区合作,联手顶尖企业、行业与技术专家,通过精彩的技术干货内容、有趣多元化的活动等诸多体验,共同为中国 IT 技术开发者搭建专业、开放的技术交流与成长的家园。未来,我们和中国万千开发者一起分享技术、践行技术,铸就中国原创技术力量。

【Python Day——北京站】现已正式启动,「新春早鸟票」火热开抢!2020年,我们还将在全国多个城市举办巡回活动,敬请期待!

活动咨询,可扫描下方二维码加入官方交流群~

CSDN「Python Day」咨询群 ????

来~一起聊聊Python

如果群满100人,无法自动进入,可添加会议小助手微信:婷婷,151 0101 4297(电话同微信)


推荐阅读

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值