简单的还是复杂的?基于软模板和专家模型深度混合的复杂性可控问题生成

最新推荐文章于 2024-09-29 20:01:44 发布

甄知科技

最新推荐文章于 2024-09-29 20:01:44 发布

阅读量1k

点赞数 3

分类专栏：问题生成文章标签：自然语言处理 pytorch 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w7851435/article/details/121824646

版权

问题生成专栏收录该内容

1 篇文章 0 订阅

订阅专栏

读论文《Simple or Complex? Complexity-Controllable Question Generation with Soft Templates and Deep Mixture of Experts Model》笔记

首先上网络结构图

Simple or Complex? Complexity-Controllable Question Generation with Soft Templates and Deep Mixture of Experts Model

Methodology

给定一篇文章、一个预期的答案和一个复杂性级别，CCQG的任务是生成具有指定复杂性的问题。

问题的复杂性取决于两个因素：
1.独立回答问题的能力（因个别学习者而异，因此找一个普遍适用的标准是不可能的）
2.回答问题所需的一般过程（理解问题的内容和背景知识，推断答案的推理步骤）

引入外部知识（模板机制），用模板生成的问题往往是流畅和自然的https://blog.csdn.net/appleml/article/details/89306681

Model Details

网络结构图
（1）基于BiLSTM的文章和答案编码器(灰色);
（2）基于MoE的模板元素选择器，用于输入专家和不同模板的复杂性和输出概率分布(绿色);
（3）通过相应复杂度的中心聚类初始化模板元素(浅蓝色)
用改进的k-means算法对每个复杂度级别的结果进行聚类，结果的聚类质心作为初始嵌入。
（4）生成模块（黄色）

LSTM解码器利用软模板和专家混合生成复杂可控问题。

复杂性评估

问题中从句的数目

事件/事实的数量是问题复杂性的有力指标。
使用nltk寻找问题的语法树来计算子句的数量

问题中某些依赖关系的数量

词语之间的某些依赖关系会影响对问题内容的理解。
计算问题中advmod, amod, nounmod, npmod的数量以及所有格修饰符

文章中句子的主题连贯性

如果句子的主题连贯性高，一篇文章就容易理解。
使用JS散度(Jensen–Shannon divergence)测量句子之间的主题连贯性

问题的实体在文章中问题出现的频率

一个关于一个经常出现在文章中的实体的问题常常是比不常见实体的问题更容易回答。
计算问题和文章中提到实体的平均频率

问题与答案之间的距离在文章中跨越

一个问题的答案通常很容易找到，如果问题中提到的实体位于同一篇文章的答案附近。
通过取问题中实体与文章中答案之间标记的平均数量来表示的距离

Classification rule

上述特征的评分函数是归一化后所有特征值的平均值
设置一个阈值λ，大于λ的为复杂问题，小于的是简单问题

关注

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

甄知科技 CSDN认证博客专家 CSDN认证企业博客

码龄14年

8: 原创

18万+: 周排名

10万+: 总排名

8287: 访问

: 等级

154: 积分

40: 粉丝

60: 获赞

5: 评论

64: 收藏

私信

关注

热门文章

分类专栏

最新评论

selenium 操作浏览器
普通网友: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
XTuner 微调 Llama3 数据格式处理
CSDN-Ada助手: 恭喜您写了第6篇博客！看到您在“XTuner 微调 Llama3 数据格式处理”上的努力和成果，真的是令人钦佩。希望您能继续保持创作的热情和耐心，不断提升自己的技术水平。下一步可以考虑分享一些实际应用案例或是深入分析一些技术细节，这样能够让更多读者受益。期待您更多优质的内容，加油！
XTuner 微调 Llama3 数据格式处理
CSDN-Ada助手: 恭喜您在博客领域又取得了新的进展，标题“XTuner 微调 Llama3 数据格式处理”听起来非常专业和有趣！希望您能继续分享您的经验和见解，让更多的读者受益。或许在下一篇博客中可以深入探讨XTuner和Llama3的使用技巧，或者分享一些数据格式处理的实用案例，让读者更好地理解和应用这些工具。期待您的下一篇精彩文章！
selenium 操作浏览器
CSDN-Ada助手: 恭喜用户写了第5篇博客！学习了如何使用selenium操作浏览器，这对于我们来说是一个很好的学习机会。希望用户能够继续保持创作的热情，分享更多关于selenium的内容，同时也建议用户可以尝试深入研究一些高级的selenium操作技巧，让读者能够更全面地了解这方面的知识。期待用户的下一篇作品！
ES:存储空间不足的时候，提示marked read-only
CSDN-Ada助手: 恭喜您写下了第四篇博客！看到您在处理存储空间不足时的解决方案，对于提示marked read-only的处理方式，我觉得很实用。希望您能继续分享更多关于ES相关的经验和技巧，也可以考虑分享一些案例分析或者实战经验，让读者更易于理解和应用。希望您继续保持创作热情，加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。