2019年顶级机器学习文章的总结概述

 

在本文中,我们将仔细研究2019年排名的一些顶级机器学习文章。

 

Facebook,卡内基·梅隆(Carnegie Mellon)建立了首个在6人扑克中击败职业玩家的AI

 

Pluribus是第一款能够在六人无限注德州扑克中击败人类专家的AI机器人,这是世界上使用最广泛的扑克格式。这是AI机器人第一次在超过两个或两个团队的复杂游戏中击败顶级人类玩家。

Pluribus经过了职业扑克玩家测试。其中包括世界扑克系列大赛的两名优胜者。Pluribus使用自我游戏来教自己如何取胜。发生这种情况时没有任何示例或指导。Pluribus中使用的自播放版本是迭代蒙特卡洛CFR(MCCFR)算法的改进版本。

在算法的每次迭代中,MCCFR都会指定一个参与者作为“遍历者”,其当前策略会在迭代中进行更新。在迭代开始时,MCCFR会根据所有玩家的当前策略(最初是完全随机的)来模拟一手扑克。一旦完成模拟手操作,该算法便会检查遍历器做出的每个决策,并通过选择其他可用操作来调查它会做的好坏。接下来,AI会评估在遵循其他可用操作之后可能做出的每个假设决策的优劣,依此类推。

 

 

https://ai.facebook.com/blog/pluribus-first-ai-to-beat-pros-in-6-player-poker

 

重量不可知神经网络(Weight Agnostic Neural Networks)

 

这篇文章提出了一种神经网络体系结构的搜索方法,该方法可以执行任务而无需任何明确的权重训练。通过使用从均匀随机分布中采样的单个共享权重参数填充连接来评估这些网络。该方法能够找到最小的神经网络架构,该架构可以执行强化学习任务而无需权重共享。

https://weightagnostic.github.io/

 

基于神经点的图形(Neural Point-Based Graphics)

 

作者提出了一种基于点的方法来对复杂场景进行建模。它使用原始点云作为场景的几何表示。然后,它通过对局部几何形状和外观进行编码的可学习的神经描述符来扩展每个点。

 

通过与描述符并行学习深度渲染网络,从而可以通过将来自新视点的点云的栅格化传递到该网络来获取场景的新视图。输入栅格化将学习到的描述符用作点伪色。

https://arxiv.org/pdf/1906.08240.pdf

 

进化选择如何训练能力更强的自动驾驶汽车(How evolutionary selection can train more capable self-driving cars)

 

在达尔文对进化的洞察力的启发下,Waymo和DeepMind的工程师着手进行一项研究项目,旨在使神经网络的训练更加有效。他们设计了一种基于进化竞争自动确定好的超参数计划的方法-基于人口的培训(PBT)。

 

对网络进行评估,并以进化的方式相互竞争以求生存。 一个性能较差的网络将被性能更佳的网络(后代)取代。 后代是种群中表现更好的成员的副本。

 

https://deepmind.com/blog/article/how-evolutionary-selection-can-train-more-capable-self-driving-cars

 

Google Research Football简介:一种新颖的强化学习环境

 

Google Research Football是增强学习环境,旨在掌握足球。

 

它提供了基于物理的3D足球模拟,代理商可以控制团队中的一名或所有足球运动员。 他们学习如何在彼此之间传递,并且能够克服对手的防守才能得分。

足球环境提供:

  •  高度优化的游戏引擎

  •  一组要求很高的研究问题,称为足球基准

  •  足球学院,一套越来越困难的RL场景

 

Beta版本可以在GitHub上找到。

 

https://github.com/google-research/football

 

https://arxiv.org/pdf/1907.11180.pdf

 

使用Python构建DAB和T姿势控制的灯光(Building Dab and T-Pose Controlled Lights with Python)

 

本文将引导您构建一个可以通过网络摄像头识别舞步的神经网络。 作者使用OpenPose检测身体位置。

https://www.makeartwithpython.com/blog/dab-and-tpose-controlled-lights/

https://github.com/burningion/dab-and-tpose-controlled-lights

 

 

在Uber借助机器学习在模拟环境中获取数据(Gaining Insights in a Simulated Marketplace with Machine Learning at Uber)

Uber Marketplace Simulation团队构建了一个仿真平台,该平台托管了一个具有骑手和驾驶员伙伴的模拟环境。 环境模仿现实世界中的场景。 它使用基于代理的离散事件模拟器。 该平台使Uber Marketplace工程师和数据科学家能够在无风险的环境中快速原型化和测试新功能。

https://eng.uber.com/simulated-marketplace/

 

安全性之外的稳健性:计算机视觉应用(Robustness beyond Security: Computer Vision Applications)

 

在本文中,作者讨论了以下计算机视觉论文:

 

https://arxiv.org/pdf/1906.09453.pdf

他们的假设是基本分类框架可用于解决具有挑战性的图像合成任务。 作者开发的工具包对所有任务使用了一个现成的分类器。 分类器经过训练,具有对抗性强。

https://github.com/MadryLab/robustness_applications

 

使用Keras和深度学习进行视频分类(Video classification with Keras and Deep Learning)

 

本文将教您如何使用Keras和Python进行视频分类。 本文介绍了如何使用CNN进行视频分类。

 

https://www.pyimagesearch.com/2019/07/15/video-classification-with-keras-and-deep-learning

 

夺旗:复杂的合作环境的出现(Capture the Flag: the emergence of complex cooperative agents)

 

 

 

本文介绍了游戏中的强化学习。 作者的最新论文展示了如何在Quake III Arena Capture the Flag中实现人类水平的表现。

作者使用锦标赛风格的评估来说明代理可以在三维多人第一人称视频游戏中达到人类水平的性能。仅分数的像素和游戏点用作输入。他们使用了两层优化过程。在此过程中,在随机生成的环境中从数千次并行匹配中同时训练一群独立的RL代理。每个代理都学习自己的内部奖励信号和对世界的丰富表示。

https://science.sciencemag.org/content/364/6443/859.full?ijkey=rZC5DWj2KbwNk&keytype=ref&siteid=sci

https://deepmind.com/blog/article/capture-the-flag-science

 

无需奖励工程的端到端深度强化学习(End-to-End Deep Reinforcement Learning without Reward Engineering)

 

 

 

本文讨论了一种端到端方法,该方法允许机器人从图像中学习,这些图像说明了特定任务的成功执行。 不应用手动奖励工程。

https://bair.berkeley.edu/blog/2019/05/28/end-to-end

https://github.com/avisingh599/reward-learning-rl

 

移动相机,移动人员:深度学习的深度学习方法(Moving Camera, Moving People: A Deep Learning Approach to Depth Prediction)

本文讨论了移动人员的深度预测。 这是通过应用基于深度学习的方法完成的,该方法从人们自由移动的视频中生成深度图。 该模型学习人体姿势,因此不依赖于直接3D三角剖分。

https://ai.googleblog.com/2019/05/moving-camera-moving-people-deep.html

 

CNN,第1部分:卷积神经网络简介(CNN's, Part 1: An Introduction to Convolutional Neural Networks)

 

 

这是卷积神经网络(CNN)的简介,包括如何使用NumPy从头开始在Python中构建一个的知识。

https://victorzhou.com/blog/intro-to-cnns-part-1

https://github.com/vzhou842/cnn-from-scratch/tree/forward-only

 

 

推进自我监督,简历,自然语言处理,以确保平台安全(Advancing self-supervision, CV, NLP to keep our platforms safe)

 

本文介绍了Facebook如何提高其内容理解系统的准确性和效率,以及如何通过减少监督学习来实现更多目标。

 

本文突出显示的主要内容是:

 

  • 内容理解的自我监督的未来

  • 使用主题标签实现视频记录设置的准确性

  • 促进最新的照片和视频理解

  • 使用多语言句子嵌入来处理有害内容

 

使用Nvidia Jetson Nano和Python以150美元的价格构建基于硬件的面部识别系统

借助Nvidia Jetson Nano,您可以构建独立的硬件系统,从而以很小的预算运行GPU加速的深度学习模型。 它就像Raspberry Pi,但速度更快。

https://medium.com/@ageitgey/build-a-hardware-based-face-recognition-system-for-150-with-the-nvidia-jetson-nano-and-python-a25cb8c891fd

 

进入逻辑电路的模块化神经进化(Descending into modular neuroevolution for logic circuits)

本文介绍了使用具有梯度下降的神经进化来构建和训练逻辑电路。

https://www.declanoller.com/2019/05/24/descending-into-modular-neuroevolution-for-logic-circuits

 

https://github.com/declanoller/hyper_NE_GD

 

总结

更多论文地址或源码下载地址:关注“图像算法”wx公众号,回顾2019年,我们看到很多作者,研究团队做出了令人难以置信的贡献,并且发表了高质量的论文和提供源码做出了非常多的贡献,感谢他们无私的奉献精神。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值