![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
machine learning
文章平均质量分 90
是不是测评机针对我
这个作者很懒,什么都没留下…
展开
-
强化学习DQN系列小结
文章目录DQN前言基本模型DQN数学记号公式推导算法流程Nature DQN优化思想算法流程三大优化Double DQN优化思想算法流程Dueling DQN优化思想Prioritized Replay DQN优化思想总结参考文献DQN前言DQN 作为 value-based 的强化学习方法,擅长处理离散情境下的强化学习问题。其本质是 deep learning 版本的 Q-learning,所以其基本模型和 Q-learning 类似,基于TD时间差分设置目标函数,并 ϵ−greedy\epsilo原创 2021-02-22 16:36:43 · 593 阅读 · 4 评论 -
Breif Introduction for Reinforcement Learning (Background Info)
文章目录Breif Introduction for Reinforcement Learning (UPDATING)Markov ChainMarkov Decision ProcessValue function: Bellman EquationBasic SolutionsDynamic Programming (?)Policy IterationValue IterationPros andc ConsMonte CarloMonte Carlo Policy EvalutionMote Ca原创 2021-01-18 16:57:01 · 339 阅读 · 0 评论 -
NLP笔记 CS224n (6) —— RNN 和 Language Model
传送门笔者在总结时跳过了第3,4,5节课。其中第3,4节课分别介绍了神经网络和反向传播,笔者假定读者有着基本的机器学习和神经网络相关的知识,所以掠过了这两章内容。其中第5节课介绍了语法结构,但是因为与笔者目前方向不一致,故略去。本节为第6节课,介绍了Language Model并且以此为契机引入了RNN模型。Language Model 语言模型天气预报说今天下雨,所以出门要________语言模型要做的事情,就是给出一段文字,由模型生成其后的内容。语言模型是NLP领域内一个bench mark原创 2020-07-06 21:04:04 · 178 阅读 · 0 评论 -
NLP笔记 CS224n (2) —— 词向量与词传感器
传送门Word2VecOptimization梯度下降,随机梯度下降。实质上是无监督学习,每个batch的最小单位可以是一组word2word的映射,输入值是一个中心词,输出值是一个其对应的outside词,要学习是从中心词要其对于outside词的映射,训练结束后只需要过程中的隐藏层信息,即词向量。More Detials of Word2Vec一个词要两个向量的原因?为了更容易优化,但是一个也行事后可以对两个向量取平均值两种变种模型Skip Grams 即由中心词预测上下文原创 2020-07-04 17:48:56 · 149 阅读 · 0 评论 -
NLP笔记 CS224n(1)—— 词向量
词向量NLP 处理文本,所以在进行处理之前,要先解决文本的表示。文本由词组成,本文讨论了表示词汇的几种方案。WordNet这种方法基于如下思想:用词汇的意义来代表词。所以我们可以建立若干个集合,每个集合代表一组同义词,每个词都可以映射到某个集合中,表示这个词汇的意思。其优点在于可以很好的处理词汇之间的联系,即同义词。但是缺点同样明显:忽略了同义词之间的差异,忽略了一词多义性难以迭代更新,忽略词语的新含义基于主观判断需要专家进行手动构造不能准确计算词汇间的相关性Discrete Sym原创 2020-07-02 16:43:24 · 166 阅读 · 0 评论 -
python axis参数解析
在遇到形如tf.argmax(logits, axis=-1)的代码时,axis参数的含义非常容易令人疑惑。在二维情形下,axis=0表示求每列的最大值的下标,axis=1表示求每行最大值的下标。但是在更高维度下呢?我们不妨假设数组A满足A.shape=(2,4,8,16),研究A生成的数组(Ax=argmax(A,axis=x))的shape,结果如下表所示:A0.shapeA1....原创 2019-01-27 13:56:20 · 911 阅读 · 0 评论 -
tensorflow自定义结构初步
0.摘要对输入值x,标签y,模型参数c,我们希望习得一个最优的Model-c满足y=Model(x,c)。机器学习的任务就是要确定这个Model中的参数。但是因为Model的形状(如层数,节点个数等)是离散的,处理起来相对麻烦,所以我们在这里只讨论可导的参数c(tensorflow的一个优势就在于可以自动求导)。我们希望对于一个确定确定的模型Model,我们要找到这样的c满足c=argmin(l...原创 2019-01-27 16:18:27 · 275 阅读 · 0 评论