猫猫猫玺-CSDN博客

原创看点儿啥

补充一些基础知识： 1. Scheduled sampling for sequence prediction with recurrent neural networks. 2. SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

2017-07-03 15:15:59 314

原创 RUBER: An Unsupervised Method for Automatic Evaluation of Open-Domain Dialog Systems

[toc] RUBER全称：Referenced metric and Unreferenced metric Blended Evaluation Routine. Introduction照例把BLEU, METEOR, ROUGE等方法批判一通，lowe的文章的那个方法（towards xxx ）需要大量的人工标注，不flexible也不extensible。 RUBER： *

2017-06-30 16:26:36 728

原创 How NOT To Evaluate Your Dialogue System

简介相关工作Evaluation Metricsword overlap-based metricsEmbedding-based metrics简介这个文章的工作：指出现存的metric的缺点，提出一个更好的metric的建议。chatbot最大的难题就是，给定一个context，valid response会非常的多。文章从word-based 以及word-embedding base

2017-06-28 16:33:50 725

原创 TOWARDS AN AUTOMATIC TURING TEST: LEARNING TO EVALUATE DIALOGUE RESPONSES

a

2017-06-22 18:34:19 581

原创 adversarial evaluation of Dialogue models- 类似gan的思路来做对话评测

常用的评价方法本文思想modelExperiment分析小总结文章链接：[Adversarial Evaluation of Dialogue Models](https://arxiv.org/abs/1701.08198v1)常用的评价方法：perplexity：从fit层面，但是不能评估在具体任务中的表现N-gram，BLEU：在翻译任务中比较好，不适用于对话human ev

2017-06-22 15:27:49 605

原创立个flag

暑假三个月专心搞论文。努力做一个技术现充（逃work hard（play harder啊今天的论文阅读计划依然没有完成。明天一半时间写大作业一半时间看论文！握拳！

2017-06-22 00:25:25 211

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 看点儿啥

原创 RUBER: An Unsupervised Method for Automatic Evaluation of Open-Domain Dialog Systems

原创 How NOT To Evaluate Your Dialogue System

原创 TOWARDS AN AUTOMATIC TURING TEST: LEARNING TO EVALUATE DIALOGUE RESPONSES

原创 adversarial evaluation of Dialogue models- 类似gan的思路来做对话评测

原创 立个flag

空空如也

空空如也

原创看点儿啥

原创立个flag