- 博客(6)
- 收藏
- 关注
转载 RL经典mode/value/policy/step/on/off
什么是强化学习?强化学习是一类算法,是让计算机实现从一开始什么都不懂,脑袋里没有一点想法,通过不断地尝试,从错误中学习,最后找到规律,学会了达到目的的方法.这就是一个完整的强化学习过程.实际中的强化学习例子有很多.比如近期最有名的 Alpha go,机器头一次在围棋场上战胜人类高手,让计算机自己学着玩经典游戏Atari,这些都是让计算机在不断
2017-09-30 12:55:26 879
转载 Visualizing and Understanding Convolutional Networks总结
Visualizing and Understanding Convolutional Networks总结Contents反卷积结构选取遮挡敏感性图片内特征相关性分析实验本文为20141024周报。在所有深度网络中,卷积神经网和图像处理最为密切相关,卷积网络在很多图片分类竞赛中都取得了很好的效果,但卷积网调参过程很不直观,很多时候都
2017-09-28 09:26:29 389
转载 AI实现方式探索和演变 ——神经网络+增强学习
神经网络+增强学习神经网络+增强学习AI实现方式探索 ——神经网络+增强学习儿时我们都曾有过一个经典游戏的体验,就是马里奥(顶蘑菇^v^),这次里约奥运会闭幕式,日本作为2020年东京奥运会的东道主,安倍最后也已经典的马里奥形象出现。平时我们都是人来玩马里奥游戏,能否可以让马里奥智能的自己闯关个呢?OK,利用人工智能的相关算法来进行自动化通关一直是一个热门的话题,最近最火的
2017-09-26 16:29:38 907
转载 20万、50万、100万的算法工程师,到底有什么区别?
转载链接:https://zhuanlan.zhihu.com/p/27072134公元七世纪,在车迟国国家气象局组织的一次求雨活动中,虎力、鹿力、羊力三位大仙成功地祈下甘霖,于水火中救了黎民。老国王虽然不明就里,却从此尊他们为国师,奉道教为圭臬。本世纪,算法工程师们的境遇也差不多:早些年,信奉糙快猛主义的大佬们觉得他们饱食终日、无所用心,没工作只好在学校混博士,靠数据上的障眼
2017-09-21 10:27:33 465
转载 内存分配方式-alloc malloc calloc
(1) 从静态存储区域分配。内存在程序编译的时候就已经分配好,这块内存在程序的整个运行期间都存在。例如全局变量,static变量。(2) 在栈上创建。在执行函数时,函数内局部变量的存储单元都可以在栈上创建,函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器的指令集中,效率很高,但是分配的内存容量有限。(3)从堆上分配,亦称动态内存分配。程序在运行的时候用malloc或ne
2017-09-18 14:58:39 992
转载 DeepMind星际争霸2开源机器学习平台
DeepMind 之前开源了《星际争霸2》的深度强化学习平台,这是个很好的训练环境,学起来也很有趣。下面是一份有关设置环境和训练模型的教程,基于Mac环境。我们会跑一遍训练脚本,使用Deep Q-Network解决CollectMineralShards这个mini-game。享受学习吧~
2017-09-06 09:16:23 5866 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人