基于关键词的文本生成----思路和思考

文本生成是最近研究的热点,他的生成源有很多,如:图片、文本、视频等。本文想针对一些特殊场合的需要关键词的文本生成工作,在这里把思路记录一下。这里使用的是传统方式,有机会会尝试深度学的方式。


(1)依赖的语法选择

如果想让句子读起来通顺,就需要一定的语法框架,但是常规的语法会有较多的问题,如主语,能够做主语的成分很多,如代词、名词甚至短语,所以生成起来不好控制,建议使用词性序列作为语法序列。

(2)关键词在词性序列上填充

在这没有考虑一个词多个词性的情况,是根据词典的方式查询的词性。

(3)备选集合生成

每种词性都会对应相应的词的集合,没有被关键词填充的位置,可以用来作为备选。

(4)最有路径选取与最优句子

找出最像句子的路径,然后重复生成多个句子的备选,选出最优的句子。这里使用语言模型做的。


效果:

key word :"孩子", "淘气"

这些 孩子 这么 淘气 呀

key word :"孩子", "可爱"

什么样 的 孩子 最 可爱 呀


一些想法:

语法模板的选择目前是随机选择,会有几率生成不出好的句子,需要对语法序列进一步归纳总结。

关键词可以通过语义进行扩展(如词嵌入)生成出更加丰富的句子。








阅读更多
个人分类: 自然语言处理
上一篇语言模型知识梳理
下一篇CRF++ 训练问题(windows)
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭