博客专栏  >  云计算/大数据   >  自然语言处理技术

自然语言处理技术

主要涉及机器学习,深度学习,推荐算法,以及自然语言处理等相关的算法和相关的技术介绍

关注
1 已关注
13篇博文
  • 自然语言处理算法之集成算法基础以及boosting与bagging简介

    在机器学习和统计学习中,集成学习(Ensemble Learning)是一种将多种学习算法组合在一起以取得更好表现的一种方法,机器学习下的集成学习主要是指有限的模型相互组合,而且可以有很多不同的结构,...

    2018-01-18 09:43
    153
  • 自然语言处理之中文分词器详解

    中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块,不同于英文的是,中文句子中没有词的界限,因此在进行中文自然语言处理时,通常需要先进行分词,分词效果将直接影响词性,句法树等模块...

    2018-01-07 13:38
    414
  • 自然语言处理之中文分词器-jieba分词器详解及python实战

    中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块,在进行中文自然语言处理时,通常需要先进行分词。本文详细介绍现在非常流行的且开源的分词器结巴jieba分词器,并使用python...

    2018-01-07 13:48
    269
  • 自然语言处理之seq2seq模型

    对于一些自然语言处理任务,比如聊天机器人,机器翻译,自动文摘等,传统的方法都是从候选集中选出答案,这对素材的完善程度要求很高,随着最近几年深度学习的兴起,国外学者将深度学习技术应用与自然语言的生成和自...

    2017-12-01 21:11
    1571
  • 自然语言处理模型之GRU和LSTM网络模型总结

    前文中小修为大家介绍了自然语言模型中LSTM (Long Short-Term Memory)网络的性质,相对于递归神经网络,LSTM网络能够避因为梯度弥散而带来的长时间的信息丢失的问题。这里小修...

    2017-12-03 11:31
    194
  • 自然语言处理技术之准确率(Precision)、召回率(Recall)、F值(F-Measure)简介

    下面简单列举几种常用的推荐系统评测指标: 1、准确率与召回率(Precision & Recall) 准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。...

    2017-12-04 15:58
    148
  • 自然语言处理之维特比(Viterbi)算法

    维特比算法 (Viterbi algorithm) 是机器学习中应用非常广泛的动态规划算法,在求解隐马尔科夫、条件随机场的预测以及seq2seq模型概率计算等问题中均用到了该算法。实际上,维特比算法不...

    2017-12-04 19:51
    179
  • 自然语言处理之文本标注问题

    文本标注 (tagging) 是一个监督学习问题,可以认为标注问题是分类问题的一个推广,标注问题又是更复杂的结构预测 (structure prediction) 问题的简单形式,标注问题的输入是一个...

    2017-12-05 14:45
    226
  • word2vec 中的数学原理背景知识详解(1)

    word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Miko...

    2017-12-13 11:12
    51
  • word2vec模型中基于 Hierarchical Softmax 的CBOW和Skip-gram模型

    word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Miko...

    2017-12-13 11:32
    43
  • word2vec 中的数学原理详解:基于 Negative Sampling 的CBOW和Skip-gram模型

    word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Miko...

    2017-12-13 11:43
    180
  • TensorFlow学习笔记(1):LSTM相关代码

    LSTM是seq2seq模型中经典的子结构,TensorFlow中提供了相应的结构,供我们使用: tensorflow提供了LSTM实现的一个basic版本,不包含lstm的一些高级扩展,同时也提供了...

    2017-12-13 14:28
    87
  • TF-IDF原理详解以及python实践

    TF-IDF(termfrequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一...

    2017-12-25 11:59
    145

img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部