【资源聚合平台进度总结】Word2Vec+TextRank实现摘要生成技术
前言在本系统中,由于自动获取的网络上的资源参差不齐,即使通过了机器的审核,仍然可能会给用户的检索带来很大困难。另一方面,现在大多主流的博客所谓自动生成摘要,其实都是自动截取前100个字符,这实在是辜负了现在人工智能和NLP技术的发展。 因此在我们的项目中,我们计划引入摘要生成技术,一是方便用户的检索查看,二是想看看能否利用其作为质量控制系统的一部分。1958年,Luhn便提出了“词频”的...
原创
2018-06-14 22:09:03 ·
4455 阅读 ·
2 评论