python自然语言处理—Pointer-Generator Networks(指针生成网络)

Pointer-Generator Networks是为了解决文本摘要中的OOV问题和word-repetition问题,它结合了生成和指针机制。通过覆盖率机制避免重复生成,适合生成式文本摘要任务。该网络在Encoder-Decoder模型基础上,能从源文本复制单词并生成新词,尤其适用于处理未登录词。
摘要由CSDN通过智能技术生成

                                               Pointer-Generator Networks(指针生成网络)

 

    随着互联网的飞速发展,产生了越来越多的文本数据,文本信息过载问题变得日益严重,对各类文本进行 "降维" 处理显得非常必要,文本摘要便是其中一个重要的手段。

    文本摘要根据摘要方法的不同可分为:

        1、抽取式文本摘要:直接从原文中选取若干条重要的句子,并对它们进行排序和重组而形成摘要的方法。

        2、生成式文本摘要:允许生成新的词语、原文本中没有的短语来组成摘要。

    使用 Seq2Seq 模型可以完成生成式摘要任务,但存在两个问题:

        1、OOV(Out-of-vocabulary 未登陆词)—训练集中未出现但测试集中出现的词

            摘要总结的结果有的时候并不准确,比如摘要的结果可能输出 "德国队以 2-1 比分击败阿根廷",但实际比分是 2-0,出现这个原因是 out-of-vocabulary words(OOV) 的出现。

        2、Word-Repetition 问题

            摘要结果会出现 repeat(重复) 的信息

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值