人工智能
老虎福
这个作者很懒,什么都没留下…
展开
-
读TensorFlow 源码笔记(1): tensorflow的多线程机制eigen::threadpool
读TensorFlow 源码笔记(1): tensorflow的多线程机制eigen::threadpool线程池的概念大家都知道,就是事先创建固定数量或者不困定数量的线程,计算并行任务是直接调用线程池里的线程,从而减少了线程的频繁创建与销毁等动作对资源的消耗。TensorFlow 是高效的深度学习计算框架,以计算子operator为单位进行调度,底层依赖于第三方数学库eigen,算子间与算子...原创 2020-03-08 22:35:04 · 2957 阅读 · 1 评论 -
强化学习笔记(3)之动态规划法
价值函数的解析解上一篇文章的马尔科夫过程是强化的学习的理论基础,其中引入了状态价值函数与状态-行为价值函数来对行为策略的评估。补充一下上一篇文章的知识。最优状态价值函数:即在当前状态下,可能发生的所有后续动作,挑选最好的动作来执行的情况下,当前这个状态的价值。最优状态行为值函数:即在当前状态下执行了特定的行为,然后考虑到执行这个行为后所有可能所处的后续状态并且在这些状态下总是挑选最好的动作来执...原创 2019-03-21 23:17:40 · 425 阅读 · 0 评论 -
强化学习笔记(4)之蒙特卡洛法
强化学习笔记(4)之蒙特卡洛法标签(空格分隔): 未分类文章目录强化学习笔记(4)之蒙特卡洛法起源蒙特卡洛法与动态规划法在强化学习中的区别首次访问与每次访问增量计算均值强化学习中的探索同策略(on-policy)异策略(off-policy)起源蒙特卡洛法是一种统计随机数来解决计算问题的一种方法,即以概率为基础的方法,名字起源于著名赌城蒙特卡洛。如下图所示,圆周率的计算,还有不规则图形面...原创 2019-03-29 22:59:08 · 1353 阅读 · 0 评论 -
TensorFlow 原生分布式训练机制探究
TensorFlow 原生分布式训练机制探究标签(空格分隔): 未分类憋屈了三个月,公司招来了个牛逼的数据科学家(遗憾:还是走了),终于公司还是配了4条V100部署在两台服务器上,可把我兴奋坏了(原谅我小农,没见过大GPU集群)。有了资源当然是要充分的利用起来啦,今天小菜带同学们一起探究TensorFlow的跨卡跨机分布式训练。TensorFlow的更新可谓是日新月异啊,15年开源以来,到...原创 2019-04-09 22:46:43 · 841 阅读 · 0 评论 -
你也可以构建的高级但却很简单的购物推荐系统--item2vec
文章目录简介简单介绍一下word2vec 和item2vec的原理简介本文可以算是一遍item2vector的工程化教程,其基本理论源自于论文《Item2Vec: Neural Item Embedding for Collaborative Filtering》(https://arxiv.org/abs/1603.04259)将引导你了解word2vec背后的思想,以及它在电商推荐系统领域...原创 2019-06-09 13:52:39 · 8149 阅读 · 8 评论 -
强化学习笔记(5)之时序差分法
强化学习笔记(5):时序差分法求值函数标签(空格分隔): 未分类文章目录强化学习笔记(5):时序差分法求值函数时序差分法与动态规划法和蒙特卡洛法的区别TD方法的反演同策略的时序差分法:SARSASARSA的收敛性SARSA($\lambda$)时序差分法与动态规划法和蒙特卡洛法的区别动态规划法(DP): 需要状态模型,即状态转移矩阵Pss′aP_{ss'}^aPss′a...原创 2019-06-03 22:28:48 · 2314 阅读 · 0 评论