Dialog
文章平均质量分 80
jinmingz
ASR SRE DeepLearning
展开
-
Q-learning 理解以及简单实现
强化学习(reinforcement learning)的过程,强化学习中有状态(state)、动作(action)、奖赏(reward)这三个要素。 智能体需要根据当前状态来采取动作,获得相应的奖赏之后,再去改进这些动作,使得下次再到相同状态时,智能体能做出更优的动作。 下面以一个综合全面的例子来理解Q-learning的过程。 http://mnemstudio.org/path-f...转载 2018-05-12 21:48:45 · 19658 阅读 · 2 评论 -
seq2seq模型中最后的Loss该如何计算
#!coding=utf-8 import numpy as np import tensorflow as tf from tensorflow.contrib.seq2seq import sequence_loss ''' 为了探究 seq2seq 中的loss具体改如何计算, 依据的标准是 tensorflow.contrib.seq2seq.sequence_loss ''' # l...原创 2019-03-24 16:37:18 · 5662 阅读 · 0 评论