文本摘要
文章平均质量分 89
Macropodus
最后一次为理想而战。安知南山桂,绿叶垂芳根。何须浅碧深红色,自是花中第一流。
展开
-
pytorch-textsummary,中文文本摘要实践
pytorch-textsummary是一个以pytorch和transformers为基础,专注于中文文本摘要的轻量级自然语言处理工具,支持抽取式摘要等。原创 2024-02-20 16:24:26 · 1432 阅读 · 1 评论 -
文本摘要(text summarization)五: 统计模型(text_pronouns、text_teaser,feature-base)
一、文本摘要(统计模型)统计模型(feature base)是深度学习兴起之前,最有效果,应用最广泛的文本摘要技术方案。统计学习方法,即便是在今天,基于统计的文本摘要模型,也是一个重要的baseline,以及高并发复杂条件下的有效算法。 应用比较多的应该是text teaser(Automatic Text Summarization for Indonesi...原创 2019-11-14 21:53:05 · 1932 阅读 · 1 评论 -
文本摘要(text summarization)四: 主题模型(LDA、LSI、NMF,topic-base)
一、文本摘要(主题模型) 百度百科这样介绍主题模型,主题模型(topic model)是以非监督学习的方式对文集的隐含语义结构(latent semantic structure)进行聚类(clustering)的统计模型。 简而言之,就是能够获取文本的隐含语义,例如腾讯和NBA,纯粹从统计学意义上,似乎风马牛不相及,但是最近的热点事件,无疑表明它们是存在隐藏意...原创 2019-11-08 22:25:49 · 5564 阅读 · 0 评论 -
文本摘要(text summarization)三: 图模型(textrank,graph-base)
一、文本摘要(textrank)文本摘要,如今,应用最广泛、速度与准确率平衡得最好的,无疑还是textrank。上世纪90年代末互联网技术突飞猛进,各种网页网站爆炸式增长,无论是雅虎式门户网站,抑或是Infoseek类搜索引擎,急需一种相对比较准确的网页重要性计算方法,给网页网站排序,使得人们能够从海量互联网世界中找出自己需要的信息。 PageRank(The...原创 2019-10-29 21:46:38 · 2652 阅读 · 0 评论 -
文本摘要(text summarization)二: 经验模型(lead3,keyword,nous-base)
一、文本摘要(Document Summarization)文本摘要,一般地我们会把它分成抽取式文本摘要和生成式文本摘要。就目前的形势而言,工业界应用广泛的还是抽取式文本摘要。抽取式文本摘要的优点很多,主题不易偏离、适应性广、速度快。 抽取式文本摘要,最最传统的方案,无疑便是Lead3算法了。 github如下:https://github....原创 2019-10-28 10:11:34 · 4351 阅读 · 0 评论 -
文本摘要(text summarization)一:语料简介概述综述与工具
一、文本摘要(Document Summarization,Toolkit工具) 文本摘要是指通过各种技术,对文本或者是文本集合,抽取、总结或是精炼其中的要点信息,用以概括和展示原始文本(集合)的主要内容或大意。作为文本生成任务的主要方向之一,从本质上而言,这是一种信息压缩技术。 文本摘要的目的是为了让用户在当今世界海量的互联网数据中找到有效的信息。实现这一点的...原创 2019-09-23 22:27:59 · 20508 阅读 · 13 评论