自然语言处理
chenpe32cp
大道至简
展开
-
用NLTK进行自然语言处理的项目
源码及说明转载 2017-04-21 15:57:01 · 535 阅读 · 0 评论 -
基于情感字典的文本情感极性分析
情感极性分析是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前者多用于舆情监控和信息预测,后者可帮助用户了解某一产品在大众心目中的口碑。 目前常见的情感极性分析方法主要是两种:基于情感词典的方法和基于机器学习的方法。 数据准备 1.情感词典及对应分数 词典来源于BosonNLP数据转载 2017-09-02 15:36:59 · 15545 阅读 · 8 评论 -
word2vec前世今生
原文地址:点击打开链接2013年,Google开源了一款用于词向量计算的工具——word2vec,引起了工业界和学术界的关注。首先,word2vec可以在百万数量级的词典和上亿的数据集上进行高效地训练;其次,该工具得到的训练结果——词向量(word embedding),可以很好地度量词与词之间的相似性。随着深度学习(Deep Learning)在自然语言处理中应用的普及,很多人误以为word2v...转载 2018-04-10 13:10:03 · 327 阅读 · 0 评论 -
如何理解LSTM网络
本文转载自点击打开链接本文译自 Christopher Olah 的博文Recurrent Neural Networks人类并不是每时每刻都从一片空白的大脑开始他们的思考。在你阅读这篇文章时候,你都是基于自己已经拥有的对先前所见词的理解来推断当前词的真实含义。我们不会将所有的东西都全部丢弃,然后用空白的大脑进行思考。我们的思想拥有持久性。传统的神经网络并不能做到这点,看起来也像是...转载 2018-08-20 18:18:37 · 205 阅读 · 0 评论 -
通俗理解HMM(隐马尔可夫模型)
本文转自这里看到一篇很通俗的HMM原理的解释,转载记录于此。HMM(隐马尔可夫模型)隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。是在被建模的系统被认为是一个马尔可夫过程与未观测到的(隐藏的)的状态的统计马尔可夫模...转载 2019-03-23 12:24:53 · 2732 阅读 · 2 评论