实战22:文本摘要实战:基于句子相似度矩阵构建图结构实现文本摘要 代码+数据

本教程介绍了无监督抽取式摘要方法TextRank,通过构建句子相似度矩阵和图结构,利用PageRank算法选取关键句子生成摘要。数据预处理包括文档分割、获取单词表示和句子表示,使用GloVe词向量进行句子表示,并通过sklearn计算cosine相似度。在构建图后,利用networkx计算PageRank值,最终得到摘要。
摘要由CSDN通过智能技术生成
  • 任务描述: 自动文本摘要(Text Summarization)是指给出一段文本,我们从中提取出要点,然后再形成一个短的概括性的文本。自动的文本摘要是非常具有挑战性的,当我们作为人类总结一篇文章时,我们通常会完整地阅读它以发展我们的理解,然后写一个摘要突出其要点。由于计算机缺乏人类知识和语言能力,它使自动文本摘要成为一项非常困难和艰巨的任务。自动摘要通常分为抽取式摘要和生成式摘要,区别在于抽取摘要选择原文中若干句子作为只要,而生成式摘要利用文本生成技术根据原文生成摘要,这个摘要会出现原文中没有出现过的句子和词。本教程介绍一个简单的无监督抽取式摘要方法TextRank算法。

  • 数据集基于句子相似度矩阵构建图结构实现文本摘要任务-数据集-深度学习文档类资源-CSDN下载

  • 运行环境

    Python>=3.6
    numpy>=1.18.0
    sklearn>=0.23.1
    networkx>=2.1
  • 方法概述:本案例主要实

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机毕设论文

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值