2018年10月_zxhohai

12月 11月 10月 09月 08月 07月 06月 04月 03月 02月 01月

原创自动文摘（Automatic document summarization）方法综述（四）——基于神经网络的（neural summarization）方法

前三篇博客（一）、（二）、（三）总结了抽取式自动文摘的一些经典方法，传统抽取式自动文摘方法将文档简单地看作是一组文本单元（短语、句子等）的集合，忽略了文档所表达的全局语义，难免“断章取义”。随着算力的提升，深度学习在很多应用中非常的火热也取得了state-of-the-art的性能，因此，将神经网络模型引入自动文摘任务是理所当然的，将文档用神经网络模型进行表示被称为神经文档模型（neural do...

2018-10-31 22:21:45 4551 2

原创 CNCC 2018技术论坛——知识图谱赋能数字经济

本周五报名参加了在杭州举办的CNCC 2018大会，听取了关于知识图谱的技术论坛——知识图谱赋能数字经济。共有6位专家讲者带来了精彩的主题报告，以及一个小时的Panel环节。本博客将整理总结分享专家的报告，共大家参考。1、周傲英：数据是催生数字经济的新动能——兼谈知识图谱的作用数字经济是什么？新动能是什么？数字经济最早在20年前提出，代表的是数字化，2016年G20峰会上，数字经济被再次提出...

2018-10-27 22:38:54 1604

原创 word2vec之CBOW模型与skip-gram模型

在对自然语言进行处理时，首先需要面对文本单元表示问题。单词（words）作为常考虑的最小文本单元，因而，如何将单词表示成恰当的词向量（word vector）成为了研究者们研究的重点。最简单直观的方法是one-hot representation，也称1-of-N representation，这种方式将每个单词表示成一个词汇表（vocabulary）大小的向量，其中绝大部分元素都是0，只有一个维...

2018-10-11 22:40:06 3697

原创自动文摘（Automatic document summarization）方法综述（三）——基于次模函数（submodular function）最大化的方法

自动文摘（Automatic document summarization）方法综述的第一篇文章（一）总结了基于中心的（Centroid-based）方法和基于图的（graph-based）方法，第二篇文章（二）总结了基于最优化的（optimization-based）的方法。这篇博客将依旧整理基于最优化方法选取文本单元的方法，更确切的说，这篇博客将聚焦在次模函数（submodular funct...

2018-10-04 21:05:49 13274

不依靠第三方库实现一个神经网络

本人实现的一个简单的神经网络，适合想了解神经网络工作流程的朋友学习，代码在jupyter notebook中实现，包含注释，文档，格式为,ipynb

2019-05-07

主题模型PPT

个人整理的主题模型介绍PPT，包括PLSA，LDA，Gibbs smaple等。

2019-02-26

基于决策树和朴素贝叶斯算法对Adult数据集分类源码

个人课设时实现的基于决策树和朴素贝叶斯算法对Adult数据集进行分类的源码！

2018-06-25

DenseNet阅读总结PPT

本人阅读CVPR2017最佳论文《Densely Connected Convolutional Networks 》后的总结PPT

2018-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 自动文摘（Automatic document summarization）方法综述（四）——基于神经网络的（neural summarization）方法