大数据挖掘SparkExpert的博客

大数据挖掘相关理论、技术与工具的学习、理解和精通掌握过程集合(Email:277433109@qq.com)...

基于seq2seq的中国古诗词自动生成技术

文本生成技术是深度学习赋予自然语言处理一项全新的技术,而刚好网上有这方面诸多的例子,因此趁着有空实现一下中国古诗的自动生成技术,还是挺好玩的。

具体步骤主要包括以下几点:

(1) 准备语料库,即对据有的古诗进行获取。

(2) 生成关键词,并进行词向量转化。

(3) 利用RNN的编码解码模型进行训练,由于RNN具备一对多的输出,因此可以很好地解决这种自动生成技术。


本文的具体参考代码为:https://github.com/DevinZ1993/Chinese-Poetry-Generation

由于原始代码是在python2.7环境下,因此需要更改多处代码才能运行。主要细节在于一些变量,filter, sorted ,cmp等这种python3所替代的方法。

(3) 测试结果如下:

做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:


慈悲
我佛




生成古诗:


岭田商步更但望,为望柴眼亩魂新。
顶情向年一羽又,好时寂中田全心。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:

我佛
慈悲





生成古诗:


千饥更琐初边臣,一花雷嶂化个残。
遂姿灵阴白鉴酒,诗宦无看烟衲骖。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:

慈悲
我佛





生成古诗:


梦郑西清超江明,重共齐时日骝归。
送河醉其堪山韵,也樽定胜自隔规。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
我佛

慈悲





生成古诗:


布胸照似细士庙,故晚攀陵诗下暇。
东池只千一叶处,我道今老一力霞。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
慈悲
我佛






生成古诗:


蝴边客云道饶偃,玉竹似病限分家。
秋说听飞眉早看,但回何满缥东佳。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:


慈悲
我佛




生成古诗:


云瑟累瓶辱州莫,楚花拄处自鹅苔。
谏是君雨是不过,叠行宝舟突髯台。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
慈悲

我佛





生成古诗:


浓枝十老不密飘,笙中北大落整长。
好问即陈梅多却,高凡到汾倚逢肠。
做诗的相关文字为: 我佛慈悲
关键词个数为:4
关键词:
慈悲
我佛






生成古诗:


猛事枝人春皪头,只向华声慈衣弦。
须似心上换皆土,数人怜少间及仙。




阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sparkexpert/article/details/71107787
个人分类: tensorflow 文本挖掘
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭