- 博客(6)
- 收藏
- 关注
原创 看点儿啥
补充一些基础知识: 1. Scheduled sampling for sequence prediction with recurrent neural networks. 2. SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient
2017-07-03 15:15:59 314
原创 RUBER: An Unsupervised Method for Automatic Evaluation of Open-Domain Dialog Systems
[toc] RUBER全称:Referenced metric and Unreferenced metric Blended Evaluation Routine. Introduction照例把BLEU, METEOR, ROUGE等方法批判一通,lowe的文章的那个方法(towards xxx )需要大量的人工标注,不flexible也不extensible。 RUBER: *
2017-06-30 16:26:36 728
原创 How NOT To Evaluate Your Dialogue System
简介相关工作Evaluation Metricsword overlap-based metricsEmbedding-based metrics简介这个文章的工作:指出现存的metric的缺点,提出一个更好的metric的建议。chatbot最大的难题就是,给定一个context,valid response会非常的多。文章从word-based 以及word-embedding base
2017-06-28 16:33:50 725
原创 TOWARDS AN AUTOMATIC TURING TEST: LEARNING TO EVALUATE DIALOGUE RESPONSES
a
2017-06-22 18:34:19 581
原创 adversarial evaluation of Dialogue models- 类似gan的思路来做对话评测
常用的评价方法本文思想modelExperiment分析小总结文章链接:[Adversarial Evaluation of Dialogue Models](https://arxiv.org/abs/1701.08198v1)常用的评价方法:perplexity:从fit层面,但是不能评估在具体任务中的表现N-gram,BLEU:在翻译任务中比较好,不适用于对话human ev
2017-06-22 15:27:49 605
原创 立个flag
暑假三个月专心搞论文。努力做一个技术现充(逃work hard(play harder啊今天的论文阅读计划依然没有完成。明天一半时间写大作业一半时间看论文!握拳!
2017-06-22 00:25:25 211
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人