自然语言处理
飞飞好奇
Fly For Fun
深入分布式、中间件、系统架构技术研究;
专注互联网金融、互联网文化娱乐行业。
展开
-
深度学习在情感分析中的应用
自然语言情感分析简介情感分析无处不在,它是一种基于自然语言处理的分类技术。其主要解决的问题是给定一段话,判断这段话是正面的还是负面的。例如在亚马逊网站或者推特网站中,人们会发表评论,谈论某个商品、事件或人物。商家可以利用情感分析工具知道用户对自己的产品的使用体验和评价。当需要大规模的情感分析时,肉眼的处理能力就变得十分有限了。情感分析的本质就是根据已知的文字和情感符号,推测文字是正面的还是转载 2017-08-23 09:41:42 · 7076 阅读 · 0 评论 -
深度学习的开源Java ML框架
作为开发人员,我们习惯从用命令或函数的角度来思考问题。程序由任务组成,每个任务都包含一些编程结构。神经网络不同于这种编程方法,因为它加入了自动任务改进的概念,或者类似于大脑的学习和改进的能力。换句话说,神经网络在没有特定任务编程的情况下主动学习新的活动。本教程不是教你从头开始编写神经网络的教程,而是介绍结合Java代码的神经网络。本文主要内容是首先介绍神经网络的发展从McCul转载 2017-11-01 09:18:10 · 3501 阅读 · 1 评论 -
开发一个智能问答机器人
近期开发了一套基于自然语言处理的问答机器人,之前没有做过python,主要做asp.net,写这篇目的是给想要开发这类智能客服系统的朋友提供一个思路,项目已经上线,但在开发和设计过程中仍然有很多问题没有得到解决,也期望和大家一同讨论学习。最终的上线效果: 开发过程大概3阶段,第一阶段 完成基础一问一答功能;第二阶段 加入意图识别,可以进一步区分用户问题,特定意图比如工资查询,将会调用第三方接口;第...转载 2018-06-26 17:03:55 · 9710 阅读 · 0 评论 -
开发一个智能问答机器人(优化篇)
上一篇介绍了整个问答机器人的技术架构和特定,本篇着重说下 如何让机器人(看起来)更智能输入联想使用jquery.autosuggest.js实现的输入联想,在输入2个字后,在5000个问答中基于全文检索,检索10条记录,供用户选择。猜你想问Chatterbot中也有阈值的概念,例如匹配度低于0.2,可定义为无法回答,但可以额外增加一个阈值,如0.5当匹配度0~0.2回复无法回答当匹配度0.2~0....转载 2018-06-26 17:05:08 · 13410 阅读 · 4 评论 -
中文自然语言处理入门流程
中文自然语言处理的完整机器处理流程简单好用的中文分词利器jieba和HanLP动手实战中文文本中的关键字提取了解数据必备的文本可视化技巧面向非结构化数据转换的词袋和词向量模型动手实战基于ML的中文短文本分类动手实战基于ML的中文短文本聚类从自然语言处理角度看HMM和CRF一网打尽神经序列模型之RNN及其变种LSTM、GRU动手实战基于CNN的电影推荐系统动手实战基于LSTM轻松...转载 2018-08-16 10:18:24 · 991 阅读 · 0 评论 -
词性编码表
参考《PFR人民日报标注语料库》的词性编码表,如下表所示:词性编码表 代码 名称 举例 a 形容词 最/d 大/a 的/u ad 副形词 一定/d 能够/v 顺利/ad 实现/v 。/w ...转载 2018-08-21 14:20:31 · 882 阅读 · 0 评论 -
QuestionAnsweringSystem技术实现简要分析
QuestionAnsweringSystem是一个Java实现的人机问答系统,能够自动分析问题并给出候选答案。IBM人工智能计算机系统"沃森"(Watson)在2011年2月美国热门的电视智力问答节目"危险边缘"(Jeopardy!)中战胜了两位人类冠军选手,QuestionAnsweringSystem就是IBM Watson的Java开源实现。本文从系统架构、主要数据结构、关键技术及代码实现...转载 2018-11-15 18:23:07 · 1115 阅读 · 1 评论 -
句法分析树标注集
ROOT:要处理文本的语句IP:简单从句NP:名词短语VP:动词短语PU:断句符,通常是句号、问号、感叹号等标点符号LCP:方位词短语PP:介词短语CP:由‘的’构成的表示修饰性关系的短语DNP:由‘的’构成的表示所属关系的短语ADVP:副词短语ADJP:形容词短语DP:限定词短语QP:量词短语NN:常用名词NR:固有名词NT:时间名词PN:代词VV:动词VC:...转载 2018-12-24 16:02:56 · 1405 阅读 · 0 评论