目前 AI 研究界里 “文本风格迁移” 有什么重大成果 ?

知乎:https://www.zhihu.com/question/56171229
关于这个问题,摘取两个我能看的懂得作者得回答
风格迁移综述:https://blog.csdn.net/s729193140/article/details/92796766

一、人民邮电出版社

文本风格迁移 堪比取色器!多种文本风格随意复制
画图软件中的取色器很多人都用过,“吸管”吸一下就能复制你想要的颜色,然后就可以把这个颜色用到任何你想要改变的素材中:
在这里插入图片描述
现在,文本的风格也能实现这样的“一键复制”了!

在这里插入图片描述
在这里插入图片描述
甚至,用这种方法还能模仿别人的笔迹:
在这里插入图片描述
在这里插入图片描述
这种针对图像中的文字进行风格迁移的任务叫做选择性文本风格迁移(Selective Style Transfer for Text):首先,自动检测图像中文本所在的区域,然后将新的文本样式应用到该区域,图像中的非文本部分保持不变。

有两种方法都实现了不错的文本风格迁移效果:两阶段法和端到端法

Two-stage两阶段法
在这里插入图片描述
1)首先根据源风格图像(上图中的Source Style Image)将整幅图像(上图中的Source Content Image)风格化;
2)利用TextFCN文本检测器确定图像中的文本区域,并计算该图像区域像素级的热图。为了让最终生成的图像只改变文本区域的风格,将原始图像和使用 TextFCN 热图加权的风格化图像进行混合。这种方法可以获得逼真的文本风格化图像,并确保非文本区域保持不变。

End-to end端到端法
在深度学习中,端到端指的是输入原始数据,输出的是最后的结果,中间的一系列操作都在神经网络内部进行,不必分模块进行处理(可以把中间的神经网络当作黑盒子)
在这里插入图片描述
受到“蒸馏策略(distillation strategy)”的启发,这项研究提出了一个新的端到端网络架构(“蒸馏”的基本思想是将能够解决不同任务的各种网络学习到的信息传递到一个模型中)
将图像风格转换网络(image style transformation network)与文本检测器结合起来,利用预训练的图像风格转换网络和文本的真实注释来训练一个随机初始化图像转换网络(上图中的Selective Style Transfer),损失函数为均方误差损失(mean squared error loss)

图像中的文本风格迁移在艺术设计和学术研究中都能发挥作用:
使用这两种方法实现文本风格迁移,可以得到充满设计感的照片,设计师能快速地找到一个场景适合的文本风格:
在这里插入图片描述
在这里插入图片描述
在上面两幅图中,左侧这一列的图像“复制”了顶端两张小图的文字风格,生成了变换风格后的图像

一些带有复杂背景的文本风格也能完美复制到别的场景中:
在这里插入图片描述
使用文本风格迁移,可以轻松切换不同的打印字体(machine printed text)风格。利用这种特点,在文本识别任务中,可以将图像中任意风格的文本转换为统一的风格,减少识别步骤。
在这里插入图片描述
这种方法还是一种非常好的数据增强工具,可以增加文本的多样性(同一段文字,不同的字体、颜色等属性),提高文本检测模型的性能。
在这里插入图片描述
在这里插入图片描述

  1. 文本检测综述
  2. 【深度学习】R-CNN 论文解读及个人理解

二、二元倒回改造架构

目前自然语言生成(NLG)领域的研究还不太实用,所以希望像人一样先理解句子,再改写句子是不太现实的。
那么能否用
机器翻译
的方法,不理解句子也能实现句子的转换?
这也是挺有局限的。机器翻译需要使用使用大量的对齐语料进行监督学习,应该是不会有人专门标注这样的语料的。不过在某些特定领域,可以通过一些巧妙的数据挖掘方式来获取语料。
例如根据新闻报道自动生成评论或摘要等,这样的题目现在很多人在做。以前我们组主要是做抽取式的摘要,现在也在尝试用seq2seq做生成。所以,假如你把新闻语料和新闻评论的关系也当做“风格转换”的话,那么答案还是存在的。

  1. 了解自然语言处理(NLP)与自然语言生成(NLG)
  2. 入门Python神经机器翻译,这是一篇非常精简的实战指南
  3. NLP之Seq2Seq
  4. 深度学习之RNN(循环神经网络)
  5. NLP之Seq2Seq
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值