使用Word Embedding构造简洁有效的文本摘要系统

本文介绍了利用Word Embedding构建文本摘要系统的两种方法,包括基于字向量叠加的简单系统和对HITS的语义改造。实验结果显示,这些简单方法在效果上与复杂的TFIDF或HITS方法相当,具有较高的实用价值。
摘要由CSDN通过智能技术生成
/* 版权声明:可以任意转载,转载时请标明文章原始出处和作者信息 .*/

                                                     author: 张俊林,黄通文,薛会萍



文本摘要是在信息泛滥的时代非常重要的工具,可以帮助用户快速判断文章内容主旨,并以此决定是否值得细看文章内容。


本文介绍下我们在2014年底2015年初时,使用WordEmbedding思想来构造文本摘要的一些思路,其中包括一种异常简单的文本摘要实现思路,实验效果证明这种方法虽然简单,可能比传统的TFIDF方法还要简单,但是效果与比较复杂的方法是相当的。


这里介绍我们做的其中两种方法,一种是非常简单的根据字Word Embedding直接叠加方式做摘要系统,另外一种是对HITS经过Word Embedding改造的文本摘要思路。


|基于字Word Embedding叠加的简洁文本摘要系统


首先,我们可以使用Word2Vec等工具获得汉字的Word Embedding。然后对于某个文档进行分句,对于每个句子使用单字的Word Embedding直接累加获得句子的Word Embedding表示;


然后,把每个句子的WordEmbedding直接累加获得整个文档的Word Embedding

评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值