【创新实训】问答系统-Question Generation模块-【博客2：评价指标&模型初探】

VictorChenSC

已于 2022-06-07 18:47:41 修改

阅读量953

点赞数 1

文章标签： nlp 神经网络

于 2021-12-27 16:42:33 首次发布

本文链接：https://blog.csdn.net/VictorChenSC/article/details/122175534

版权

【创新实训】问答系统-Question Generation模块-【博客2：评价指标&模型初探】

摘要由CSDN通过智能技术生成

前面一篇博客主要探究了QG（Question Generation）任务的基本策略：

博客1：基本策略
博客2：评价指标、初步探索
博客3：训练数据和预测数据预处理的部分
博客4：模型的构建
博客5：生成“问答对”
博客6：问答对有效性过滤（基于文本分类任务）
博客7：用问题库检索服务

一、评价指标

我们可以参考机器翻译任务中的评价指标

1.1 BLUE

1）早期的BLUE公式：
- $y$ 为文本， $y^{i}$ 为参考文本
- $C(g, y^{i})$ 表示 $g$ 在参考文本中 $y^{i}$ 出现的次数
- $G_n(y)$ 表示y的n元组集合
  $BLUE-n=p_n=\frac{\sum_{g \in G_n(y)}C(g, y^{i})}{\sum_{g \in G_n(y)}C(g, y)}$
2）改进精确率后的公式：
- BP为长度惩罚因子
- $BP= \begin{cases}
  $BLUE-n=p_n=\frac{\sum_{g \in G_n(y)}min\{C(g, y), \underset{1 \le i \le m}{max} C(g, y^{i})\}}{\sum_{g \in G_n(y)}C(g, y)}$

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

VictorChenSC

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【创新实训】问答系统-Question Generation模块-【博客2：评价指标&模型初探】

【创新实训】问答系统-Question Generation模块-【博客2：评价指标&模型初探】
复制链接

扫一扫

评估指标_基于问答推荐的评估指标设计

weixin_39787606的博客

12-23

687

智能问答系统中知识库的构建是重中之重，问答库的构建可以分为三个阶段。第一个阶段：人工构建问题-答案对；第二个阶段：自动挖掘问题，人工填写答案；第三个阶段：自动构建问答对。第一个阶段多见于现在的通用问答平台，第二个阶段是目前问答系统落地的主流，特别是针对长尾问题的解决；第三个阶段是问答库构建的高阶。假设问答对能够自动构建，由于自动化的方案无法保证绝对的正确，因此对于答案的使用，采用推荐的思...

问答系统QA的评价指标MAP、MRR、Accuracy@N

lppfwl的博客

09-29

6120

问答系统性能的评价指标MAP、MRR、Accuracy@N MAP(mean average precision) 即平均准确率，系统对所有候选答案进行评分，并按分值大小进行排序，正确答案越靠前，MAP值就越大计算方式如下：参考：https://www.jianshu.com/p/e1664861bc9d 比如共有三个问题，问题1有3个直接相关的答案，问题2有2个直接相关的答案，问题3有4个直接相关的答案。系统返回的答案中，问题1的3个答案的排序为1，3，5；问题2的2个答案的排序为2，3；问题3的4

参与评论您还未登录，请先登录后发表或查看评论

问答系统评测方法

theLostLamb的博客

02-21

4317

平均排序倒数平均排序倒数（Mean Reciprocal Rank,简称MRR）是一个国际上通用的对搜索算法进行评价的机制，即将第一个结果匹配，分数为1，第二个匹配分数为0.5，第n个匹配分数为1/n，如果没有匹配的句子分数为0。最终的分数为所有得分之和。公式如下：信赖加权评分查准率查全率调和平均数其中β是参数，P是查准率，R是查全率，当参数β=1时，就是常见的F1-Measure了:...

知识图谱问答的测评指标

漠月的博客

04-02

4560

(1）精确率。精确率（Precision）指问答方法对每个自然语言问句给出的黄金标准答案（问题对应的一个标准答案）占所有返回答案总数的比例。精确率计算公式可以形式化表示： (2）召回率。一个自然语言问句可能存在多个标准答案，如：问题“杭州有那些景点？”就有多个标准答案，因此需要评测知识图谱问答方法召回完整答案的能力。召回率（Recall）表示知识图谱问答方法返回的正确答案数占返回的黄金标准答案的比例。召回率计算公式可以形式化表示为： (3）准确率。准确率（Accuracy）表示知识图谱问答方法回答正确的

questiongenerator:一个简单的问题生成器

05-31

问题生成器一个简单的问题生成器，由 Retrospring（以前的 justask）使用。安装将此行添加到应用程序的 Gemfile 中： gem 'questiongenerator' 如果您感到前卫，可以添加以下行： gem 'questiongenerator', git: 'https://github.com/retrospring/questiongenerator.git' 用法 require 'questiongenerator' # Configure it QuestionGenerator . question_base_path = '/home/nilsding/questions' QuestionGenerator . default_locale = :en # Compile the questions for increased ra

文本生成评估指标详解及计算（BLEU）

arvinChen的博客

06-07

5489

BELU详解及计算实例

问答系统评估指标之ROUGE-L和BLUE-N

stuShan

06-30

5240

如何评测问答系统给出的一个答案的好坏 ? 常用的有 ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation)和 BLEU-4（Bilingual Evaluation Understudy）两个指标，这两个指标的人类最高分都在58分左右。 ROUGE-L 的 L 是指LCS(longest common subsequence，最长公共子序列)的首字母。 BLEU-4 的 -4 是指4元精确率的BLEU值，也就是从1-gram计算到4-gram，当

【创新实训】问答系统-Question Generation模块-【博客5：预测生成模块】

VictorChenSC的博客

06-07

689

前面四篇博客主要探究了QG（Question Generation）任务的基本策略、评价指标；描述了我的初步探索；以及给出了数据处理的方法以及训练模型的构建方法：这一部分主要将“训练好的模型”应用在数据预处理部分得到的教材数据上，期望能够对教材生成一系列问题。为了测试生成的模型的性能，我选取部分测试数据，将其放在my_test.json文件中，其格式和训练数据导入时的格式相同。生成答案的时候，infer.py程序主要完成下面几个步骤：1.加载模型权重； 2.构建问题生成器； 3.加载预测数据，并对篇章、答

SG-Deep-Question-Generation:该存储库包含本文的代码和模型

04-30

该存储库包含该论文的代码和模型：。下面是我们提出的模型的框架（在右侧）以及一个输入示例（在左侧）。要求环境 allennlp 1.0.0 allennlp-models 1.0.0 pytorch 1.4.0 nltk 3.4.4 numpy 1.18.1 tqdm 4.32.2 ...

BERT-Embedding-Frequently-Asked-Question:使用BERT的基于常见问题的问答系统

05-01

BEFAQ(BERT Embedding Frequently Asked Question) 开源项目是好好住面向多领域FAQ集合的问答系统框架。我们将Sentence BERT模型应用到FAQ问答系统中。开发者可以使用BEFAQ系统快速构建和定制适用于特定业务场景的...

Question-Generation-Paper-List:神经问题生成（NQG）必读论文的摘要

05-04

问题生成纸张列表神经问题生成（NQG）必读论文的摘要由和贡献。 ... 2.9其他方向 2.应用 2.1难度可控的QG ...基本的Seq2Seq模型要注意产生问题。学习提问：用于阅读理解的神经问题生成。 ACL，2017年。论文

Turkish-Reading-Comprehension-Question-Answering-Dataset:土耳其语阅读理解问答数据集

05-30

ENELPI - 问答系统 我们是谁？您好，我们是三位截至 2020 年毕业于 Adnan Menderes 大学计算机工程系的朋友。我们的名字分别是 Okan Çiftçi、Uğurcan Kök 和 Filiz Gözet。自从我们进入该部门以来，我们三...

java开发oa系统源码-Qanary-question-answering-components:Qanary-问答组件

06-05

java开发oa系统源码简而言之：Qanary 问答组件致力于创建问答系统。问答 (QA) 是一项需要不同领域的任务，导致昂贵/耗时的工程任务可能会阻碍研究，因为它太昂贵了。开发问答系统时可能出现的典型问题/用例是： ...

【创新实训】问答系统-Question Generation模块-【博客7：问题库后端检索与服务接口】

VictorChenSC的博客

06-07

346

由于这个项目需要和整体的QA系统进行交互，QG模块预生成问题作为检索的一大重要部分，需要充当后端，为前端提供检索服务。对于已经生成的问题库，我采用Lucene对生成的问题检索，具体来讲，它的输入输出如下：输入：输出：我们采用 User-Client 模式构建前后端的交互。............

【创新实训】问答系统-Question Generation模块-【博客6：Q-A pairs有效性过滤】

VictorChenSC的博客

06-07

412

在前面步骤中，使用问题生成器生成的系列问题可能存在很多无效的问题，此处我将采取Bert对序列进行分类，筛选出无效的生成的问题。

【创新实训】问答系统-Question Generation模块-【博客4：模型架构的搭建与训练过程】

VictorChenSC的博客

06-07

801

前面三篇博客主要探究了QG（Question Generation）任务的基本策略、评价指标；描述了我的初步探索；以及给出了数据处理的方法：正如前文所提到，我在“‘万创杯’中医药天池大数据竞赛”问题生成赛题的第一名的解决方案的基础上进行适当扩展。包的导入和相关参数的设置，具体参数尤其是BatchSize部分我结合模型的训练的实际情况做了一定的调整。端到端地实现“篇章 + 答案 → 问题”，使用“NEZHA + UniLM”的方式来构建一个Seq2Seq模型。.........

问答系统（QA）调研

丝萝愿为乔木的博客

02-24

2159

问答系统调研

智能问答客服系统的设计和开发（ssm(spring mvc+mybatis)+netty4）

毕业作品网站

10-19

2521

首先是排队等候信息的推送，因为客户服务的数量有限，每个客户服务的数量也是有限的，当有更多的客户进入网站系统需要进入人工客户服务时，我们就需要将这些客户加入排队等候中，确保他们按先到后服务的顺序进入。首先是数据记录的保存，主要有两部分，一是聊天记录，因为聊天记录是最核心的数据，其次是客户服务人员的操作记录，例如，客户服务人员的在线时间，客户服务人员访问客户的次数等，这些数据都要及时上传到数据库。根据我们前面部分的分析，智能客服问答系统最关键的功能就是客户申请客服，客服与客户交流，解答客户问题，最后关闭连接。

LLM - 神经网络的组成

最新发布

07-05

441

计算方式是输入向量X，在权重矩阵W和偏置向量B的作用下，经过激活函数，产生n个输出（输出是一个向量）4. 为什么要引入激活函数？因为如果不引入激活函数，多层神经网络会塌缩成一层神经网络，如下图示意，神经网络每层都是线性变换，最终多层网络的结果只相当于一层网络。1. 一个神经元的结构：即接受多个输入X向量，在一个权重向量W和一个偏执标量b的作用下，经过激活函数后，产生一个输出。3. 多次神经网络的结构：由输入层，隐层，输出层组成，每一层的输出结构是由上一层的线性变换和激活函数得到。5. 激活函数有哪些？

用java编写在线考试管理系统----试题信息管理模块子任务: 添加试题查询试题删除试题更新试题

04-28

好的，针对在线考试管理系统中试题信息管理模块的子任务，我们可以采用如下的Java代码实现：首先，我们需要定义一个试题类（Question），包含以下属性： ```java public class Question { private String questionId; //试题ID private String questionType; //试题类型 private String questionContent; //试题内容 private String optionA; //选项A private String optionB; //选项B private String optionC; //选项C private String optionD; //选项D private String correctAnswer; //正确答案 } ``` 接下来，我们可以定义一个试题管理类（QuestionManager），包含添加试题、查询试题、删除试题、更新试题等方法： ```java import java.util.ArrayList; import java.util.List; public class QuestionManager { private List<Question> questions = new ArrayList<>(); //试题列表 //添加试题 public void addQuestion(Question question) { questions.add(question); } //查询试题 public Question getQuestionById(String questionId) { for (Question question : questions) { if (question.getQuestionId().equals(questionId)) { return question; } } return null; } //删除试题 public void deleteQuestion(String questionId) { Question question = getQuestionById(questionId); if (question != null) { questions.remove(question); } } //更新试题 public void updateQuestion(Question question) { Question oldQuestion = getQuestionById(question.getQuestionId()); if (oldQuestion != null) { oldQuestion.setQuestionType(question.getQuestionType()); oldQuestion.setQuestionContent(question.getQuestionContent()); oldQuestion.setOptionA(question.getOptionA()); oldQuestion.setOptionB(question.getOptionB()); oldQuestion.setOptionC(question.getOptionC()); oldQuestion.setOptionD(question.getOptionD()); oldQuestion.setCorrectAnswer(question.getCorrectAnswer()); } } } ``` 这样，我们就可以在试题管理模块中实现添加试题、查询试题、删除试题、更新试题等功能了。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交