![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
人工智能
v.xpace
我,程序员!
展开
-
强化学习入门之马尔可夫决策过程(MDP)
马尔可夫决策问题(MDP)是一个四元组的问题,包含环境状态空间X,Agent的动作空间U,环境的迁移函数f,以及奖赏函数p1.状态X环境的状态集X定义为一个有穷集合{x1,x2,x3.....xn},其中n表示状态空间大小。2.动作空间UAgent的动作集U定义为一个有穷集合{u1,u2,u3.....um},其中m为动作空间的大小。3,迁移函数及奖赏函数迁移函数是描述采取原创 2017-04-28 08:50:35 · 1554 阅读 · 0 评论 -
TensorFlow:多层感知器解决异或问题
import numpy as npimport tensorflow as tfdata_x=np.array([[0,0],[0,1],[1,0],[1,1]],dtype=np.float32)data_y=np.array([[0],[1],[1],[0]],dtype=np.float32)x=tf.placeholder(tf.float32,shape=[None,2],...原创 2018-08-11 13:54:15 · 1594 阅读 · 0 评论 -
量子遗传算法详解与应用
量子遗传算法详解与应用,很详细的介绍与解释:https://blog.xupengit.top/index.php/20181210/cid=35.html原创 2018-12-19 11:21:09 · 7922 阅读 · 2 评论 -
强化学习之Q-learning算法详解与应用
强化学习之Q-learning算法详解与应用:https://blog.xupengit.top/index.php/20171218/cid=57.html原创 2018-12-19 11:25:14 · 1153 阅读 · 0 评论 -
多种聚类算法比较
多种聚类算法比较:https://blog.xupengit.top/index.php/20170103/cid=7.html原创 2018-12-19 11:28:15 · 554 阅读 · 1 评论