NLP
文章平均质量分 86
学术状态抽奖器
Be self
展开
-
Python下的自然语言处理利器-LTP语言技术平台 pyltp 学习手札
1 什么是pyltp 语言技术平台(LTP) 是由 哈工大社会计算与信息检索研究中心 11 年的持续研发而形成的一个自然语言处理工具库,其提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、 高效、精准的自然语言处理技术。LTP制定了基于XML的语言处理结果表示,并在此基础上提供了一整套自底向上的丰富而且高效的中文语言处理模块(包括词法、句法、语义等6项中文处原创 2016-09-10 20:44:20 · 31138 阅读 · 12 评论 -
RNN的入门烹饪指南
本文首发于如下微信号:循环神经网络RecurrentNeural Network (RNN),是一个拥有对时间序列显示建模能力的神经网络。RNN相对于传统前馈神经网络的“循环”之处具体表现为RNN网络会对之前输入的信息进行记忆归纳,并把这份“记忆”应用于当前的计算。理论上来说,RNN非常适用于处理序列数据、并且可以支持对任意长度的序列处理。RNN网络图及展开示意图原创 2017-07-20 11:14:01 · 1417 阅读 · 0 评论 -
GENSIM 使用笔记1 --- 语料和向量空间
1 本篇说明本篇博客来源于GENSIM官方向导文档的第一章,主要供自己后续的翻阅,并通过分享带给诸位网友一个小小的参照。从字符串到向量在这一小节当中,将会讲述如何通过gensim,将一段文本以向量的形式表示。 首先我们看一下我们的基本文档形式:documents = [ '拍照反光一直是摄影爱好者较为苦恼的问题', '尤其是手机这种快速拍照设备的成像效果总是难以令人满意',原创 2016-12-25 15:35:37 · 3153 阅读 · 0 评论 -
GENSIM 使用笔记2 — 主题模型和相似性查询
GENSIM 使用笔记1 — 语料和向量空间 GENSIM 使用笔记2 — 主题模型和相似性查询 在上一个笔记当中,使用gensim针对中文预料创建了字典和语料库,在这一章节中,主要讲下如何创建相应的主题模型和相似度的匹配,对应原教程的第二章和第三章模型创建在GENSIM当中,最基本的就是创建TF-IDF模型,随后可以在TF-IDF的基础上创建LSI/LDA等等的主题模型。 GENSIM已经封原创 2016-12-25 17:04:45 · 5073 阅读 · 1 评论 -
深度学习(BOT方向) 学习笔记(2) RNN Encoder-Decoder 及 LSTM 学习
深度学习(BOT方向) 学习笔记(2) Sequence2Sequence 学习21 前言这个系列的笔记拖了很久了,一直没时间仔细详细写,一来是因为自己能力不足,学习进度也很慢,二是真的很懒,也没有什么outline,所以一直拖着没写,现在终于挤出第二篇来了。话说之前的第一篇,我很匆忙的写了写Sequence2Sequence RNN-Encoder-Decoder的框架,写的不是很认真,这篇博客则原创 2016-11-25 22:28:28 · 17545 阅读 · 8 评论 -
深度学习(BOT方向) 学习笔记(1) Sequence2Sequence 学习
1 前言这个深度学习,其实是来自每周Paper笔记的整理版,即文章的主要内容其实是我对一篇文章的整理,受限于个人水平,可能很多地方会出现理解偏差、或者理解不到位的地方,所以如果发现什么不对的地方欢迎交流。之前我一直不想发这个博文,因为觉得我水平实在有限,不过现在看来还是不论好坏,拖出来见见光好了。所以这个系列的博文的主要内容是我每周Paper阅读的笔记整理,偶尔穿插着一些实验内容。文章的具体信息我会原创 2016-10-16 20:47:51 · 18803 阅读 · 0 评论 -
要不,和机器聊聊?-- 小谈Bot系统
系列目录: 要不,和机器聊聊?– 小谈Bot系统 Seq2Seq Chatbot 聊天机器人:基于Torch的一个Demo搭建 手札 深度学习(BOT方向) 学习笔记(1) Sequence2Sequence 学习 深度学习(BOT方向) 学习笔记(2) RNN Encoder-Decoder 及 LSTM 学习 深度学习(BOT方向) 番外1 Seq2Seq的变种VHRED MrRN原创 2016-11-29 12:39:32 · 2984 阅读 · 0 评论 -
深度学习(BOT方向) 番外1 Seq2Seq的变种VHRED MrRNN
系列目录: 要不,和机器聊聊?– 小谈Bot系统 Seq2Seq Chatbot 聊天机器人:基于Torch的一个Demo搭建 手札 深度学习(BOT方向) 学习笔记(1) Sequence2Sequence 学习 深度学习(BOT方向) 学习笔记(2) RNN Encoder-Decoder 及 LSTM 学习 深度学习(BOT方向) 番外1 Seq2Seq的变种VHRED MrRN原创 2016-11-27 20:51:57 · 3475 阅读 · 0 评论 -
Python版的Word2Vec -- gensim 学习手札 中文词语相似性度量 V1.1
前言相关内容链接: 第一节:Google Word2vec 学习手札 昨天好不容易试用了一下Google自己提供的Word2Vector的源代码,花了好长时间训练数据,结果发现似乎Python并不能直接使用,于是上网找了一下Python能用的Word2Vector,这么一找,就找到了gensimgensim(应该要翻墙): http://radimrehurek.com/gensim/model原创 2016-08-24 20:10:37 · 17140 阅读 · 7 评论 -
Seq2Seq Chatbot 聊天机器人:基于Torch的一个Demo搭建 手札
说明@MebiuW 之前在微博爱可可那里看见一个用Seq2Seq做的聊天机器人,正好下来跑一下代码研究研究。。所以有了这篇手札这篇手札相对完整,即便你环境没什么也能跑Torch安装安装Torch,安装官方的说法,使用git克隆代码后进行安装。 默认安装在了主目录的torch文件下,大家可以根据自己的需求进行更改,安装需要联网下载依赖,还是需要耐心等待下的。git clone https://gi原创 2016-10-07 15:40:44 · 10299 阅读 · 5 评论