基于GPT的传统中国诗词生成-论文笔记

原论文:《GPT-based Generation for Classical Chinese Poetry》
arXiv:1907.00151v2 [cs.CL] 2 Jul 2019

该论文使用GPT模型去生成中国传统诗词。


模型:基于BERT源码实现的GPT

  • 预训练:8 Nvidia V100(16GB) GPUs for 4 epochs,90 hours
  • 微调:使用自动回归语言模型

在这里插入图片描述

训练数据

  • 预训练:中国新闻语料
  • 微调训练:作者等人收集的开放可用的传统中国诗词
    • 格式:[form,identifier 1,theme,identifier 2,body]
      • 例子:五言绝句(格式)静夜思(主题)床前明月光,疑...月,低头思故乡。
    • 对联的格式:上联为 theme,下联为 body
      • 例子:对联(格式)一句相思吟岁月(主题)几分寂寞醉诗词
Training PhasesCorpus typeCorpus size
Pre-trainingChinese news235M sentences
Fine-tuningJueju and Lvshi、Cipai、Couplet250000 Jueju and Lvshi,20000 Cis,700000 pairs of couplets

诗句生成
输入form与theme,虽然不限定生成文本格式上的正确性,但模型仍旧能自动判定诗词的“,”与“。”的位置。当输出“EOS”时,结束生成。
文中使用了 Truncated top-k sampling,结果显示,生成的文本具有正确的格式。

训练藏头诗模型
方法:将藏头的内容替换原来诗句的标题
例子:五言绝句(格式)床疑举低(藏头诗)床前明月光,疑...月,低头思故乡。


论文里给出的例子:
在这里插入图片描述
在这里插入图片描述

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值