2017年09月_dlphay

转载 RL经典mode/value/policy/step/on/off

什么是强化学习？强化学习是一类算法,是让计算机实现从一开始什么都不懂,脑袋里没有一点想法,通过不断地尝试,从错误中学习,最后找到规律,学会了达到目的的方法.这就是一个完整的强化学习过程.实际中的强化学习例子有很多.比如近期最有名的 Alpha go,机器头一次在围棋场上战胜人类高手,让计算机自己学着玩经典游戏Atari,这些都是让计算机在不断

2017-09-30 12:55:26 879

转载 Visualizing and Understanding Convolutional Networks总结

Visualizing and Understanding Convolutional Networks总结Contents反卷积结构选取遮挡敏感性图片内特征相关性分析实验本文为20141024周报。在所有深度网络中，卷积神经网和图像处理最为密切相关，卷积网络在很多图片分类竞赛中都取得了很好的效果，但卷积网调参过程很不直观，很多时候都

2017-09-28 09:26:29 389

转载 AI实现方式探索和演变 ——神经网络+增强学习

神经网络+增强学习神经网络+增强学习AI实现方式探索 ——神经网络+增强学习儿时我们都曾有过一个经典游戏的体验，就是马里奥（顶蘑菇^v^），这次里约奥运会闭幕式，日本作为2020年东京奥运会的东道主，安倍最后也已经典的马里奥形象出现。平时我们都是人来玩马里奥游戏，能否可以让马里奥智能的自己闯关个呢？OK，利用人工智能的相关算法来进行自动化通关一直是一个热门的话题，最近最火的

2017-09-26 16:29:38 907

转载 20万、50万、100万的算法工程师，到底有什么区别？

转载链接：https://zhuanlan.zhihu.com/p/27072134公元七世纪，在车迟国国家气象局组织的一次求雨活动中，虎力、鹿力、羊力三位大仙成功地祈下甘霖，于水火中救了黎民。老国王虽然不明就里，却从此尊他们为国师，奉道教为圭臬。本世纪，算法工程师们的境遇也差不多：早些年，信奉糙快猛主义的大佬们觉得他们饱食终日、无所用心，没工作只好在学校混博士，靠数据上的障眼

2017-09-21 10:27:33 465

转载内存分配方式-alloc malloc calloc

（1）从静态存储区域分配。内存在程序编译的时候就已经分配好，这块内存在程序的整个运行期间都存在。例如全局变量，static变量。（2）在栈上创建。在执行函数时，函数内局部变量的存储单元都可以在栈上创建，函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器的指令集中，效率很高，但是分配的内存容量有限。（3）从堆上分配，亦称动态内存分配。程序在运行的时候用malloc或ne

2017-09-18 14:58:39 992

转载 DeepMind星际争霸2开源机器学习平台

DeepMind 之前开源了《星际争霸2》的深度强化学习平台，这是个很好的训练环境，学起来也很有趣。下面是一份有关设置环境和训练模型的教程，基于Mac环境。我们会跑一遍训练脚本，使用Deep Q-Network解决CollectMineralShards这个mini-game。享受学习吧~

2017-09-06 09:16:23 5866 1

dlphay的博客

转载 RL经典mode/value/policy/step/on/off

转载 Visualizing and Understanding Convolutional Networks总结

转载 AI实现方式探索和演变 ——神经网络+增强学习

转载 20万、50万、100万的算法工程师，到底有什么区别？

转载内存分配方式-alloc malloc calloc

转载 DeepMind星际争霸2开源机器学习平台

空空如也

空空如也

转载 RL经典mode/value/policy/step/on/off

转载 Visualizing and Understanding Convolutional Networks总结

转载 AI实现方式探索和演变 ——神经网络+增强学习

转载 20万、50万、100万的算法工程师，到底有什么区别？

转载 内存分配方式-alloc malloc calloc

转载 DeepMind星际争霸2开源机器学习平台

空空如也

空空如也

转载内存分配方式-alloc malloc calloc