深度学习论文笔记
Loki97
这个作者很懒,什么都没留下…
展开
-
【深度学习NLP论文笔记】《Visualizing and Understanding Neural Models in NLP》
1 Introduction神经网络对于NLP任务的可解释性很差。深度学习模型主要是基于word embedding词嵌入(比如low-dimensional,continuous,real-valued vector)。在本文中,我们使用传统方法,比如representation plotting,并使用一些简单策略来评估一个神经元(neural unit)对于语义构建(meaning ...原创 2018-08-18 20:48:23 · 1907 阅读 · 0 评论 -
【深度学习NLP论文笔记】《Understanding Neural Networks through Representation Erasure》
Abstract提出一种一般方法来分析神经网络的决策:清除一些部分的表示(various parts of the representation),例如输入的单词向量的维度(input word-vector dimensions)、中间隐藏单元(intermediate hidden units)、输入单词(input words),来看看这样会产生什么影响。评估清除(erasure...原创 2018-08-18 19:33:10 · 1101 阅读 · 0 评论 -
【深度学习NLP论文笔记】《Deep Text Classification Can be Fooled》
Abstract当前存在的加扰算法不能直接应用于文本上。三种对文本的加扰策略:插入(insertion)、修改(modification)、移除(removal)。本文针对DNN文本分类器(DNN-based text classifiers)进行fool。Introduction文本分析很重要:垃圾网站、钓鱼网站(spam or phishing webpage)的检测依靠文本分...原创 2018-08-20 21:33:19 · 1295 阅读 · 1 评论 -
【深度学习NLP论文笔记】《Towards Crafting Text Adversarial Samples》
Abstract文本fool的方法:修改原始样本:删除或替换一些重要的单词,或引入新的单词。我们的算法最适用于在每个类的例子中有子类别的数据集。基于情绪分析的IMDB电影评论数据集和性别检测的Twitter数据集的实验结果显示了我们所提出的方法的有效性。1.introduction使用Word2Vec方法进行数据预处理和特征提取。但是Word2Vec的离散特征使得将向量映射到单词变...原创 2018-08-20 21:41:34 · 1875 阅读 · 0 评论 -
【深度学习NLP论文笔记】《Interpretable Adversarial Perturbation in Input Embedding Space for Text》
Abstract在CV领域,常常用对抗训练(adversarial training)来产生扰动并提高模型鲁棒性,但如果把这种方法直接应用在词嵌入空间会丢失可解释性(interpretability)。本文提出的方法就是对嵌入空间的单词做扰动方向上的约束(restrict the direction of perturbation),从而保留了可解释性。1 Introduction...原创 2018-08-21 20:42:02 · 2232 阅读 · 0 评论 -
【深度学习NLP论文笔记】《Adversarial Example For Natural Language Classification Problems》
一、介绍图一:三个在文本分类任务中使用对抗样本的例子。分别是垃圾邮件分类、情感分析、虚假新闻检测。全是依靠同义词替换实现的。 二、背景分类问题的目标是从输入和标签中学习一种映射。其中标签可能来自K个类,如。分类器f可能是个深度神经网络或者线性模型,它会为输入x在每个类中的可能性做出评分,并将评分最高的那个类作为输入的标签。在图片分类器中,对正常输入x做扰动后得到x',将其送...原创 2018-09-20 20:16:05 · 2555 阅读 · 0 评论 -
【深度学习NLP论文笔记】《Greedy Attack and Gumbel Attack: Generating Adversarial Example for Discrete Data》
这篇文章的数学定义推导和算法说明部分大都没有看懂,所以笔记写得极烂,因为文中很多数学定义相当模糊,写得也很绕。在ICLR2019评审中一位盲审直接给出“poorly written”的意见。ICLR2019 OpenReview 但这篇大概率还是会中,原作者也更新了一版论文,待评审结果出来我会试着重新更新该笔记,先占个坑。Abstract 我们提出一种【对离散数据进行对抗攻击】...原创 2018-11-25 15:39:14 · 1738 阅读 · 0 评论