语言模型:Trigram-语言模型

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 该系列将描述一些自然语言处理方面的技术,完整目录请点击这里。 有很多种定义语言模型的方式,在这里我们将重点介绍一种特别重要的方式,即三元语言模型(Trigram la...

2018-05-22 12:09:12

阅读数:1186

评论数:0

语言模型:Trigram-模型的平滑估计

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 该系列将描述一些自然语言处理方面的技术,完整目录请点击这里。 正如我们前面讨论的,三元语言模型有非常多的参数。利用最大似然估计会造成一个很严重的问题,就是很多的值都会...

2018-05-22 12:08:50

阅读数:407

评论数:0

语言模型:马尔可夫模型

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 该系列将描述一些自然语言处理方面的技术,完整目录请点击这里。 这个教程,我们将要讨论语言模型的关键问题:给定一个语料库,我们如何学习到概率 p? 在这一部分,我们将利...

2018-05-22 12:08:26

阅读数:99

评论数:0

语言模型:介绍

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 该系列将描述一些自然语言处理方面的技术,完整目录请点击这里。 这个专题,我们主要学习如何从一个句子中来构建一个语言模型。语言模型最早是应用在语音识别的问题上,当然它们...

2018-05-22 12:07:55

阅读数:269

评论数:0

五个入门深度学习自然语言处理资源

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 这里收集了五个入门深度学习自然语言处理资源,这些资源为你介绍了目前一些最新的技术。它也为你提供了一些下一步自然语言发展的方向。 1.Deep Learning for...

2018-05-17 23:18:25

阅读数:261

评论数:0

入门自然语言处理数据集

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 在开始深入的学习自然语言处理任务时,我们需要准备一些数据集用来训练自己的算法。 在选择数据集上面,你最好使用可以快速下载的小的数据集,这种数据不用花太多的时间来训练模型。...

2018-05-17 23:17:39

阅读数:619

评论数:0

如何为聊天机器人设计数据通道

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai ](http://upload-images.jianshu.io/upload_images/1155267-e4bd0a1164368068.jpeg?imageMog...

2018-05-17 23:16:46

阅读数:93

评论数:0

如何入门NLP

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 有时候当我被一个问题问到两次的时候,我就觉得我应该把对这个问题的回答整理成一篇文章。基于这个原因和为了节约我未来的时间,今天我就对“如何入门NLP”这个话题,写成了一篇...

2018-05-17 23:16:28

阅读数:384

评论数:0

利用-TensorFlow-实现上下文的-Chat-bots

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 在我们的日常聊天中,情景才是最重要的。我们将使用 TensorFlow 构建一个聊天机器人框架,并且添加一些上下文处理机制来使得机器人更加智能。 )](http://up...

2018-05-17 23:16:10

阅读数:113

评论数:0

利用-TensorFlow-入门-Word2Vec

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 我认为学习算法的最好方法就是尝试去实现它,因此这个教程我们就来学习如何利用 TensorFlow 来实现词嵌入。 这篇文章我们不会去过多的介绍一些词向量的内容,所以很...

2018-05-17 23:15:47

阅读数:50

评论数:0

在-TensorFlow-上实现的-Word2Vec-教程

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 在这篇教程中,我们尝试使用深度学习模型来预测文本序列。但是,在我们利用深度学习处理文本之前,我们需要先学习一些 NLP 的基础信息。其中,一个比较重要的想法是将文字转化...

2018-05-09 10:48:53

阅读数:87

评论数:0

在-TensorFlow-上使用-LSTM-进行情感分析

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 你可以从 Github 上面下载到所有的源代码。 在这篇教程中,我们将介绍如何将深度学习技术应用到情感分析中。该任务可以被认为是从一个句子,一段话,或者是从一个文...

2018-05-09 10:48:33

阅读数:1847

评论数:0

Gensim-中-word2vec-函数的使用

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai Gensim 是我比较常用的一个 NLP 工具包,特别是其中的 word2vec 模块,它的具体 API 如下: class gensim.models.word2vec...

2018-05-09 10:48:00

阅读数:657

评论数:0

Chatbot-架构

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai Chatbot 的开发者越来越多了,一些创业公司都开始开发自己的聊天机器人产品,包括提供平台类的,提供API 的,提供分析工具的等等。很多的博客,杂志和视频都充满着工业...

2018-05-09 10:47:38

阅读数:156

评论数:0

NLTK-下载语料库遇到的问题

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 首先我们使用 pip3 下载 nltk 语料库。 pip3 install nltk 之后,我们在终端中进行语料库的安装 import nltk nltk.dow...

2018-05-09 10:47:08

阅读数:177

评论数:0

从-Quora-的-187-个问题中学习机器学习和NLP

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai Quora 已经变成了一个获取重要资源的有效途径。许多的顶尖研究人员都会积极的在现场回答问题。 以下是一些在 Quora 上有关 AI 的主题。如果你已经在 Quor...

2018-05-07 11:03:18

阅读数:62

评论数:0

机器学习算法在文本分类中的应用综述

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 机器学习的一个主要应用就是在文本分类领域,比如我们去检测一些垃圾邮件,去定义一个文章的属性,或者去挖掘一篇文章的关键信息。在这篇文章中,Roman Trusov 对机器...

2018-05-06 17:23:52

阅读数:262

评论数:0

词级语言建模与字符级语言建模

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 目前在自然语言理解问题中,字符级语言建模得到越来越多的关注。在这里,我简单地比较了一下字符级语言模型和词级语言模型。 词级语言建模是指把词作为文本信息的最小单位。在语义空...

2018-05-06 17:23:30

阅读数:188

评论数:0

标记问题:生成模型和噪声通道模型

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 该系列将描述一些自然语言处理方面的技术,完整目录请点击这里。 在本节中,我们描述一个重要的监督学习模型。 接下来,我们来介绍一个用于标记问题的特定生成模型——隐...

2018-05-06 17:23:12

阅读数:64

评论数:0

标记问题:介绍

作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 该系列将描述一些自然语言处理方面的技术,完整目录请点击这里。 在很多的 NLP 问题中,我们想对两个序列进行建模,词性标注(POS)问题可能是最早也是最有名的一个案例...

2018-05-06 17:22:46

阅读数:44

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭