- 博客(4)
- 资源 (4)
- 收藏
- 关注
原创 自动文摘(Automatic document summarization)方法综述(四)——基于神经网络的(neural summarization)方法
前三篇博客(一)、(二)、(三)总结了抽取式自动文摘的一些经典方法,传统抽取式自动文摘方法将文档简单地看作是一组文本单元(短语、句子等)的集合,忽略了文档所表达的全局语义,难免“断章取义”。随着算力的提升,深度学习在很多应用中非常的火热也取得了state-of-the-art的性能,因此,将神经网络模型引入自动文摘任务是理所当然的,将文档用神经网络模型进行表示被称为神经文档模型(neural do...
2018-10-31 22:21:45 4551 2
原创 CNCC 2018技术论坛——知识图谱赋能数字经济
本周五报名参加了在杭州举办的CNCC 2018大会,听取了关于知识图谱的技术论坛——知识图谱赋能数字经济。共有6位专家讲者带来了精彩的主题报告,以及一个小时的Panel环节。本博客将整理总结分享专家的报告,共大家参考。1、周傲英:数据是催生数字经济的新动能——兼谈知识图谱的作用数字经济是什么?新动能是什么?数字经济最早在20年前提出,代表的是数字化,2016年G20峰会上,数字经济被再次提出...
2018-10-27 22:38:54 1604
原创 word2vec之CBOW模型与skip-gram模型
在对自然语言进行处理时,首先需要面对文本单元表示问题。单词(words)作为常考虑的最小文本单元,因而,如何将单词表示成恰当的词向量(word vector)成为了研究者们研究的重点。最简单直观的方法是one-hot representation,也称1-of-N representation,这种方式将每个单词表示成一个词汇表(vocabulary)大小的向量,其中绝大部分元素都是0,只有一个维...
2018-10-11 22:40:06 3697
原创 自动文摘(Automatic document summarization)方法综述(三)——基于次模函数(submodular function)最大化的方法
自动文摘(Automatic document summarization)方法综述的第一篇文章(一)总结了基于中心的(Centroid-based)方法和基于图的(graph-based)方法,第二篇文章(二)总结了基于最优化的(optimization-based)的方法。这篇博客将依旧整理基于最优化方法选取文本单元的方法,更确切的说,这篇博客将聚焦在次模函数(submodular funct...
2018-10-04 21:05:49 13274
不依靠第三方库实现一个神经网络
2019-05-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人