基于关键词的文本生成----思路和思考

原创 2018年04月17日 18:59:27

文本生成是最近研究的热点,他的生成源有很多,如:图片、文本、视频等。本文想针对一些特殊场合的需要关键词的文本生成工作,在这里把思路记录一下。这里使用的是传统方式,有机会会尝试深度学的方式。


(1)依赖的语法选择

如果想让句子读起来通顺,就需要一定的语法框架,但是常规的语法会有较多的问题,如主语,能够做主语的成分很多,如代词、名词甚至短语,所以生成起来不好控制,建议使用词性序列作为语法序列。

(2)关键词在词性序列上填充

在这没有考虑一个词多个词性的情况,是根据词典的方式查询的词性。

(3)备选集合生成

每种词性都会对应相应的词的集合,没有被关键词填充的位置,可以用来作为备选。

(4)最有路径选取与最优句子

找出最像句子的路径,然后重复生成多个句子的备选,选出最优的句子。这里使用语言模型做的。


效果:

key word :"孩子", "淘气"

这些 孩子 这么 淘气 呀

key word :"孩子", "可爱"

什么样 的 孩子 最 可爱 呀


一些想法:

语法模板的选择目前是随机选择,会有几率生成不出好的句子,需要对语法序列进一步归纳总结。

关键词可以通过语义进行扩展(如词嵌入)生成出更加丰富的句子。








基于seq2seq的中国古诗词自动生成技术

文本生成技术是深度学习赋予自然语言处理一项全新的技术,而刚好网上有这方面诸多的例子,因此趁着有空实现一下中国古诗的自动生成技术,还是挺好玩的。 具体步骤主要包括以下几点: (1) 准备语料...
  • sparkexpert
  • sparkexpert
  • 2017-05-03 10:50:14
  • 1507

基于语义的中文文本关键词提取算法

  • 2013年09月29日 16:15
  • 306KB
  • 下载

TF-IDF在关键词自动提取、计算文本相似度和摘要自动生成上的应用

此博文虽然标记为原创,实际上市从
  • wusecaiyun
  • wusecaiyun
  • 2014-09-09 18:04:07
  • 2278

文本关键词提取算法及自动摘要

蛙蛙推荐:蛙蛙牌关键词提取算法 使用TextRank算法为文本生成关键字和摘要 TextRank算法提取关键词的Java实现...
  • u014568921
  • u014568921
  • 2016-07-26 14:51:04
  • 5278

TextRank算法为文本生成关键字和摘要

TextRank算法基于PageRank,用于为文本生成关键字和摘要。其论文是: Mihalcea R, Tarau P. TextRank: Bringing order into texts...
  • xiaocong1990
  • xiaocong1990
  • 2017-05-21 20:55:03
  • 672

github上搜索生成文本的关键词

 github上搜索生成文本的关键词 1、char rnn 2、language generation 3、theano rnn lstm gru...
  • liuhongyue
  • liuhongyue
  • 2016-09-12 16:37:05
  • 569

文本挖掘----基于OCR的文档关键字提取

前言做了一段时间的OCR,把大量的图片、PDF处理成了文本。请注意:这些文本在互联网上属于稀有资源。这些文本以前都放在一个盒子里,如今,用OCR做钥匙打开盒子。取出东西,是好是坏也没人知道。但是,总得...
  • guzhenping
  • guzhenping
  • 2016-04-16 22:41:21
  • 6399

自动提取文本关键词demo

# coding=utf-8 # !/usr/bin/env python ''' 【数据源】 随机抽取新浪新闻23篇(newsTxt.txt)及其文末标注的关键词(newsKw.txt),其中一行为...
  • wy_0928
  • wy_0928
  • 2017-06-27 15:08:34
  • 4156

使用TextRank算法为文本生成关键字和摘要

目录[-] PageRank 使用TextRank提取关键字 使用TextRank提取关键短语 使用TextRank提取摘要 实现TextRank TextRank算法基于...
  • xiewenbo
  • xiewenbo
  • 2015-06-28 15:07:52
  • 10975

基于TextRank的关键词、短语、摘要提取

关于自动文摘利用计算机将大量的文本进行处理,产生简洁、精炼内容的过程就是文本摘要,人们可通过阅读摘要来把握文本主要内容,这不仅大大节省时间,更提高阅读效率。但人工摘要耗时又耗力,已不能满足日益增长的信...
  • u013041398
  • u013041398
  • 2016-09-08 18:20:59
  • 8710
收藏助手
不良信息举报
您举报文章:基于关键词的文本生成----思路和思考
举报原因:
原因补充:

(最多只允许输入30个字)