ML
Lcyztf
这个作者很懒,什么都没留下…
展开
-
CS231n Notes Linear Classification
1. Linear Classifier 在数学上是如下的式子:每个example都是一个column vector,可以把W矩阵的每行看作一个针对每个类别的classifier。 针对W和b可以有(直观上)两种理解: (1)hyperplane:在high dimensional space上将data points线性分开。 (2)template matching: Each r...原创 2018-07-17 16:36:28 · 279 阅读 · 0 评论 -
Multi-source attention mechanism
一、Attention Strategies for Multi-Source Sequence-to-Sequence Learning 本文主要考虑多encoder和单个RNN decoder的scenario.主要分为以下三种来讨论: 1、Concatenation of the context vectors A widely adopted technique for combin...原创 2018-09-06 20:54:28 · 812 阅读 · 0 评论 -
论文阅读:Best of Both Worlds: Transferring Knowledge from D to G
首先pretrain D和G,然后fix D,让G不断sample response,然后根据D的监督信号进行更新。这里使用Gumbel Softmax来解决non-differentialable problem。 作者从MLE(or equivalently CE)的generic and safe response问题入手,指出MLE训练的生成模型容易“game” MLE,会倾向于“av...原创 2018-09-09 16:03:41 · 290 阅读 · 0 评论