自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

想去旅游

大熊猫和小熊猫都好可爱呀

  • 博客(6)
  • 收藏
  • 关注

原创 看点儿啥

补充一些基础知识: 1. Scheduled sampling for sequence prediction with recurrent neural networks. 2. SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

2017-07-03 15:15:59 314

原创 RUBER: An Unsupervised Method for Automatic Evaluation of Open-Domain Dialog Systems

[toc] RUBER全称:Referenced metric and Unreferenced metric Blended Evaluation Routine. Introduction照例把BLEU, METEOR, ROUGE等方法批判一通,lowe的文章的那个方法(towards xxx )需要大量的人工标注,不flexible也不extensible。 RUBER: *

2017-06-30 16:26:36 728

原创 How NOT To Evaluate Your Dialogue System

简介相关工作Evaluation Metricsword overlap-based metricsEmbedding-based metrics简介这个文章的工作:指出现存的metric的缺点,提出一个更好的metric的建议。chatbot最大的难题就是,给定一个context,valid response会非常的多。文章从word-based 以及word-embedding base

2017-06-28 16:33:50 725

原创 TOWARDS AN AUTOMATIC TURING TEST: LEARNING TO EVALUATE DIALOGUE RESPONSES

a

2017-06-22 18:34:19 581

原创 adversarial evaluation of Dialogue models- 类似gan的思路来做对话评测

常用的评价方法本文思想modelExperiment分析小总结文章链接:[Adversarial Evaluation of Dialogue Models](https://arxiv.org/abs/1701.08198v1)常用的评价方法:perplexity:从fit层面,但是不能评估在具体任务中的表现N-gram,BLEU:在翻译任务中比较好,不适用于对话human ev

2017-06-22 15:27:49 605

原创 立个flag

暑假三个月专心搞论文。努力做一个技术现充(逃work hard(play harder啊今天的论文阅读计划依然没有完成。明天一半时间写大作业一半时间看论文!握拳!

2017-06-22 00:25:25 211

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除