![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 59
菜鸟ccc
这个作者很懒,什么都没留下…
展开
-
对话摘要综述
原创 2022-04-07 18:29:56 · 254 阅读 · 0 评论 -
关键词抽取算法TopicRank
1、文本预处理,分词,POS 2、筛选候选词,保留最长的名词和形容词序列; 3、采用HAC(层次凝聚聚类算法)聚类;(在超过25%重叠词的情况下,认为两个候选序列是相似的) 编辑 添加图片注释,不超过 140 字(可选) 解释HAC 聚类算法 4、权重计算 w(i,j)为权重,其中 dist(ci, cj ) 是文档中候选关键词 ci 和 cj 的偏移位置的倒数,其中 pos(ci) 表示候选关键词 ci 的所有偏移位置,节点之间全部有连接,无向图。 ...原创 2022-02-13 18:39:50 · 861 阅读 · 0 评论 -
自动会议摘要HMNet(2020-SOTA),生成式文本摘要
A Hierarchical Network for Abstractive Meeting Summarization with Cross-Domain Pretraining.EMNLP2020 一、研究动机: 1、建模困难:角色多、交互、文本长、话题跳转 2、数据少 二、文章主要贡献: 1、提出Hierarchical Transformer,能够融合整个对话文本和角色信息,端到端地生成会议摘要; 2、采用新闻摘要数据构造伪会议摘要数据做预训练。 三、实现 (1)原创 2022-02-13 17:23:50 · 807 阅读 · 0 评论 -
自动会议摘要DDAMS,2021-SOTA,生成式文本摘要
论文:Dialogue Discourse-Aware Graph Model and Data Augmentation for Meeting Summarization 一、研究动机 1. 会议文本建模不充分 2. 大规模训练数据集缺乏 二、文章主要贡献 1、引入对话篇章结构,提取句子之间交互结构信息; 2、通过DDADA构建的伪摘要数据集是原数据集大小的20倍,可以有效地用于预训练DDAMS会议摘要模型; 三、实现 (1)伪数据构建,Dialogue Discourse-原创 2022-02-13 17:20:32 · 1582 阅读 · 0 评论 -
无监督文本摘要,生成式文本摘要
论文:Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and Context-Aware Auto-Encoders.AAAI2021 算法概要: 基于相似度选择对话主题句,然后借助降噪自编码器生成对话摘要。 训练:1、采用对比学习的思想训练句子相似度计算模型; 2、训练降噪自编码器用于后续生成对话摘要。 测试:基于MMR的想法,综合考虑重要性和冗余度选取对话主题句,然后使用降噪自编码器生成最终摘要。原创 2022-02-11 22:31:48 · 1154 阅读 · 0 评论