博客专栏  >  架构   >  自然语言处理

自然语言处理

自然语言处理

关注
3 已关注
12篇博文
  • 中文文本相似度的研究有什么用

    前言人与计算机的交互过程中,如果能提供人类的自然语言形式来进行交流,那人与计算机就能更加亲密友好。而要实现这一机制就需要自然语言处理来处理,一般来说自然语言处理会涉及几个学科:计算机科学、语言学、统计...

    前天 16:51
    609
  • n元语法

    语言模型在统计自然语言处理中语言模型是很重要的一块,常用的语言模型是n元语法模型,当然现在比较流行的还有神经网络语言模型。n元语法模型需要额外的平滑处理,而神经网络语言模型则不必,它自带平滑效果。n元...

    2017-11-28 09:16
    361
  • 机器学习之条件随机场(CRF)

    什么是CRFCRF即条件随机场(Conditional Random Fields),是在给定一组输入随机变量条件下另外一组输出随机变量的条件概率分布模型,它是一种判别式的概率无向图模型,既然是判别式...

    2017-11-09 14:46
    606
  • 来自麻省理工的信息抽取

    MITIEMITIE 即 MIT 的 NLP 团队发布的一个信息抽取库和工具。它是一款免费且先进的信息抽取工具,目前包含了命名实体抽取、二元关系检测功能,另外也提供了训练自定义抽取器和关系检测器的工具...

    2017-11-02 08:51
    742
  • 谈谈谷歌word2vec的原理

    word2vec在NLP领域中,为了能表示人类的语言符号,一般会把这些符号转成一种数学向量形式以方便处理,我们把语言单词嵌入到向量空间中就叫词嵌入(word embedding)。谷歌开源的word2...

    2017-08-10 20:14
    2582
  • 如何用TensorFlow训练词向量

    前言前面在《谈谈谷歌word2vec的原理》文章中已经把word2vec的来龙去脉说得很清楚了,接下去这篇文章将尝试根据word2vec的原理并使用TensorFlow来训练词向量,这里选择使用ski...

    2017-08-24 15:21
    2460
  • 如何用TensorFlow训练聊天机器人(附github)

    前言实际工程中很少有直接用深度学习实现端对端的聊天机器人,但这里我们来看看怎么用深度学习的seq2seq模型来实现一个简易的聊天机器人。这篇文章将尝试使用TensorFlow来训练一个基于seq2se...

    2017-09-28 08:59
    11102
  • 设计一个智能客服系统

    背景:最近在设计一个公司的智能客服系统,通过对现有人工客服语料作为样本,通过训练样本完成整个QA过程或业务办理过程。整体思路 AliceBot负责闲聊,这里用了开源的语料,也可以添加语料到DB,基于A...

    2017-03-14 17:55
    3832
  • 如何用机器学习对文本分类

    需求使用监督学习对历史数据训练生成模型,用于预测文本的类别。样本清洗主要将重复的数据删除掉,将错误无效的数据纠正或删除,并检查数据的一致性等。比如我认为长度小于少于13的数据是无效的遂将之删掉。def...

    2017-05-30 20:21
    894
  • 开源一个文本分析项目

    Githubhttps://github.com/sea-boat/TextAnalyzerTextAnalyzera text analizer that can analyze text. so ...

    2017-06-12 18:18
    1220
  • kmeans实现文本聚类

    需求拿到的需求是输入n个文本,对文本进行聚类,由于这些输入不能通过历史数据进行训练,所以这个主要就是用无监督学习来解决。kmeans谈到聚类就会想到kmeans,它的核心思想是给定的K值和K个初始质心...

    2017-06-22 20:13
    1112
  • 如何使用中文维基百科语料

    前言在做自然语言处理时很多时候都会需要中文语料库,高质量的中文语料库较难找,维基百科和百度百科算是比较不错的语料库。其中维基百科会定时将语料库打包发布 https://dumps.wikimedia....

    2017-10-26 08:54
    702

JDK源码
3083644
机器学习&深度学习
3358912
mysql协议
2027773
Hazelcast
525348
通信框架Tribes
821133
集群
1760178
tomcat内核
81286848
Java并发
1963640
java开源研究
39154202
img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部