机器学习
文章平均质量分 68
雷梧
人都是被逼出来
展开
-
学习笔记-增强学习
增强学习增强学习的一个简单定义就是学习基于奖励或惩罚的最佳动作。 在增强学习中有三个概念:状态、动作和回报。“状态”是描述当前情况的。对一个正在学习行走的机器人来说,状态是它的两条腿的位置。对一个围棋程序来说,状态是棋盘上所有棋子的位置。“动作”是一个智能体在每个状态中可以做的事情。给定一个机器人两条腿的状态或位置,它可以在一定距离内走几步。通常一个智能体只能采取有限或者固定范围内的动作。例如一个原创 2017-01-13 20:49:24 · 468 阅读 · 0 评论 -
学习笔记-对抗生成网络
We propose a new framework for estimating generative models via an adversarial process, in which we simultaneously train two models原创 2017-01-15 21:41:21 · 1454 阅读 · 0 评论 -
知识图谱中推理技术进展及应用
知识图谱中推理技术进展及应用主要内容知识图谱历史回顾语义网络vs.知识图谱vs.本体基于符号的推理方法基于统计的推理方法知识推理在问答和搜索中的应用总结和展望知识图谱历史“the power of an AI program came to be seen as largely in its knowledge base”,Edward Feigenbaum,1994 ACM Turin翻译 2017-02-15 15:53:49 · 5680 阅读 · 0 评论 -
马尔可夫链的扩展-----贝叶斯网络
马尔可夫链的扩展—–贝叶斯网络马尔可夫链:一种状态序列,其每个状态值取决于前面有限个状态。原创 2017-02-07 21:08:15 · 957 阅读 · 0 评论 -
损失函数整理
DSH中的哈希函数Lr(b1,b2,y)=∑Ni=1{12(1−yi)||bi,1−bi,2||22+12yimax(m−||bi,1−bi,2||22,0)+α(|||bi,1|−1||1+|||bi,2|−1||1)}L_r(b_1, b_2, y) = \sum_{i=1}^N \{\frac{1}{2}(1-y_i)||b_{i,1}-b_{i,2}||_2^2+\frac{1}{2}y_i原创 2017-06-27 15:49:34 · 4989 阅读 · 1 评论