可控文本生成研现状与技术

提示:文本生成是nlp的重要领域,而可控文本生成的出现对于NLP研究具有重大意义。边学边总结不断更新,先把大框架搞好。


前言

可控文本生成目前在聊天机器人,智能问答,新闻撰写,营销文案生成,线上商品标题自取以及简介生成等多种领域发挥了巨大作用。可控文本生成需要模型具有一定的发散能力,而中文文化又博大精深,汉字又是离散的状态,这使得文本生成在建模上更加多样,复杂。传统的文本生成建模一般采用seq2seq,最近几年转向了GAN。


提示:以下是寻欢桑做的一点总结欢迎大家批评指正

一、可控文本生成任务

人类是通过从外界获取,学习和储存知识,可以迅速理解对话里的内容,从而做出合适的回复,机器必须结合考虑上下文才能回答的差强人意。在文本生成任务中,“知识”是对输入文本和上下文的一种“补充”,可以由不同方法和信息源获得,包括但不限于关键词,主题,键值对,知识图谱等,这些“知识”可以通过不同的表示方法学习到有效的知识表示,用于增强文本生成任务的生成效果,这就被称为知识增强的文本生成(Knowledge-Enhanced Text Generation)。因此,知识增强的文本生成主要有两个难点:如何获取有用的知识,以及如何理解并借助知识促进文本生成。在这里插入图片描述

通过关键字生成可控文本

通过关键字约束可以有效缓解ovv问题,生成更加准确,多样的回答。
用关键词同时约束主题和情感 代表论文 论文A Syntactically Constrained Bidirectional-Asynchronous Approach for Emotional Conversation
用关键词作为硬约束,预测的一定出现在生成的文本中 代表论文阅读Sequence to Backward and Forward Sequences: A Content-Introducing Approach to
用关键词作为软约束 代表论文 Towards Implicit Content-Introducing for Generative Short-Text Conversation Systems

通过知识图谱生成可控文本

有些需要结合外部知识图谱来生成,比如演员的代表作,领域等等知识图谱可以帮助机器生成更加丰富,有意义的文本。
知识图谱 代表论文Knowledge-based Review Generation by Coherence Enhanced Text Planning
给定 topic 集合,生成主题相关、段落集的文 代表论文 Enhancing Topic-to-Essay Generation with External Commonsense Knowledge

通过键值对生成可控文本

通过键值对生成可控文本

通过标题生成可控文本

从原文拷贝内容输出到结果 代表论文 Get To The Point: Summarization with Pointer-Generator Networks
通过标题生成可控文本

基于文本增强的文本生成

二、文本生成模型与挑战

1.模型

1.可持续学习的能力。面对多个任务时,需要有效的学习机会,实现跨任务知识的有效迁移。最近的一些工作主要是引入自适应的组合模块,保证模型的持续学习能力和知识迁移能力,同时采用轻量化微调技术。
三种典型的新任务学习方法是:

①完全的参数共享,在预训练模型的基础上做一次重新的训练;

②插入一些特定任务的参数;

在新任务的任务时选择性插入一些历史任务参数。

预训练模型(Pretrained Models)

利用大规模的无标注数据集预训练模型,这些模型可以为文本生成任务模型提供更好的模型初始化。
知识图谱 代表论文Knowledge-based Review Generation by Coherence Enhanced Text Planning
prefix-tuning的改进 代表论文 使用对比前缀生成可控文本本 Controllable Natural Language Generation with Contrastive Prefixes

2.挑战

近年来由于深度学习的复兴,文本生成取得了巨大的进展,但依旧存在生成文本不流畅,答非所问等问题。生成信息丰富、连贯性强的评论文本是自然语言生成中一个具有挑战性的任务。

三、文本生成的小子类 评论生成

现阶段就在做这个东西,接近于水军的意思。但是做中文的好难

四、可控文本生成实现的一般方法

1.调整解码策略(解码端加入一些限制词,增加目标词汇的概率。)
是生成的结果尽可能的包含在目标内容中()
2.调整目标函数(以学习面向情感分类任务的目标,这样可以使得模型学习到情感信息。)
构建面向特定任务的可控训练目标函数
3.调整模型输入(这种方法主要是在模型输入的时候添加一些可控的因素,通过这些因素影响生成结果。)
通过输入控制元素影响生成结果

参考文献:
刘明童博士基于预训练语言模型的可控文本生成研究与应用
知乎 Knowledge-Enhanced Text Generation: 知识增强的文本生成研究进展

总结

今年一月份能够把这个坑填了

文本生成过程可以看做是一个序列化的多标签分类问题,它可以通过负对数似然(NLL)损失进行优化。因此,文本生成模型的目标函数是一个最大化似然估计(MLE)

首先,设计更加有效的知识表示方法然后融入文本生成过程中仍然是这个研究方向最重要的趋势。其次,研究者们应该探索如何更广泛地发现知识,并将不同来源的多种形式的知识结合起来,以改进生成过程。例如,多任务学习可以实现知识表示和文本生成之间的相互增强与相互促进。

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
增强现实技术在计算机网络课程中的应用全文共2页,当前为第1页。增强现实技术在计算机网络课程中的应用全文共2页,当前为第1页。增强现实技术在计算机网络课程中的应用 增强现实技术在计算机网络课程中的应用全文共2页,当前为第1页。 增强现实技术在计算机网络课程中的应用全文共2页,当前为第1页。 1 引言计算机网络课程是高等院校计算机专业不同方向的学生必修专业课程,课程的系统性、理论性和实践性均很强。由于专业方向不同,前期开设课程也不同,因此,学生对计算机知识的掌握情况也各有不同,学生的知识掌握情况和动手实践能力有较大的差距,为激发不同层次学生学习的积极性,提高其学习效率,需要采用交互式与体验式教学方法来进行教学。增强现实( Augmented reality,简称 AR) ,是一种结合虚拟化技术观察世界的方式,它将现实与虚拟混合起来,利用计算机技术,将虚拟的信息应用到真实环境,在用户所视的现实环境中叠加虚拟的场景,为用户呈现一个效果真实的新环境。增强现实技术加强了人们和现实世界的交互性,提高了人们对现实世界的感知能力,在计算机网络课程教学中具有广泛的应用前景。   2 增强现实的组件增强现实需要将图像实时添加到真实的环境中,并使得这些图像适应用户的头部及眼睛的转动,保证图像始终在用户视角范围内。建立一个增强现实系统,必须有三个组件: 头戴式显示器、跟踪与配准技术、移动计算能力。   本文于 2011 -01 -13 收到。微 计 算 机 应 用 2011 年2. 1 头戴式显示器头戴式显示器( HMD) 可以使用户看到由增强现实系统生成文本和图像,其芯片面积很小,能植入眼镜框架。芯片可以追踪佩戴者目光,从而确定佩戴者指令,HMD 与显示器相连的个人电子助理( PDA) 接受指令后呈像,图像再通过芯片投射到佩戴者视网膜,便可看到增强的真实世界。头戴式显示器如图 1 所示。   2. 2 跟踪与配准技术跟踪与配准技术必须能够识别用户所处的位置、跟踪用户的眼睛和头部转动的位置,并且映射出与用户在任何特定时刻看到的真实世界相关的图像。由于其跟踪定位的复杂性,如标记被遮挡、环境光线的明暗变化或短暂地移出视线外的时候,都会导致系统清除虚拟物体。因此,实际应用中多数使用由各种跟踪定位技术构成的混合系统。图 2 是基于标记的视觉惯性跟踪系统实验图。   基于标记的视觉惯性跟踪系统实验789 期 杨洋: 增强现实技术在计算机网络课程中的应用2. 3 移动计算能力移动式增强现实系统是增强现实应用的发展趋势之一,它需要有较强的移动计算能力来创建三维立体图形,其关键技术主要包括传感器技术、显示和系统结构设计等几个方面。   3 计算机网络课程教学现状3. 1 理论教学环节全国高校中,计算机网络课程的教学多数侧重基本原理,学生缺乏主动思考的能力,自主性学习不强。教学内容表现形式单一,授课课件基本是千篇一律的 PowerPoint 课件或静态网页,大部分教师按照课程教材内容进行讲解,学生基本上是在被动地接受信息,师生互动性不强,学生的创新能力和自学能力得不到提高。另外,由于计算机技术更新较快,目前的计算机网络课程中尚有一些讲授的内容明显滞后于信息时代的发展,加上课时不足的原因,教师对于网络最新前沿技术介绍的较少,学生学完之后,不能学以致用。   3. 2 实践教学环节在实践教学中,由于实践基地、实验设备、实验耗材和资金等问题的限制,大多数学校重理论轻实践,学生的动手实践机会较少,很难将理论付诸于真实网络环境的实践。由于大多数的实验环节缺乏创新性,即使在实践课上,学生也是进行重复验证性的实验过程,这样不利于学生创新思维和主动思考能力的培养。   4 增强现实技术在计算机网络课程教学中的应用将增强现实技术应用到计算机网络课程教学中,使得虚拟信息与实际教学环境相结合,构建虚实交互的学习环境,这种体验式和交互式的教学方法将激发学生的学习兴趣,使学生较好地将理论和实际相结合。   4. 1 可视化讲解教师可以利用增强现实技术对实践教学中的网络设备进行可视化讲解。在课堂上,可以使用鼠标在屏幕投影空间选择三维的网络设备模型目标进行讲解,并实时地绘制成相应的图像,在指定的位置叠加显示该网络设备性能的详细参数和信息,给学生以更增强现实技术在计算机网络课程中的应用全文共2页,当前为第2页。增强现实技术在计算机网络课程中的应用全文共2页,当前为第2页。加直观的学习体验,学生可以清晰地看到网络设备的"内部结构";,这是在传统实践课中无法实现的。   4. 2 构建虚拟实验环境增强现实技术在计算机网络课程教学中的另一种应用是构建虚拟实验环境。在实践课中,可以使用贴有标记的木板或塑料板将虚拟的三维按钮动态的叠加在标记板上,使之成为一个虚拟的控制面板,该虚拟控制面板可以用来操纵相关的虚拟

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值