自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 NLTK学习之四:文本信息抽取

1 信息抽取从数据库中抽取信息是容易的,但对于从自然文本中抽取信息则不那么直观。通常信息抽取的流程如下:它开始于分句,分词,接下来进行词性标注,识别其中的命名实体,最后使用关系识别搜索相近实体间的可能的关系。

2017-08-19 17:20:20

阅读数 18115

评论数 1

原创 NLTK学习之三:文本分类与构建基于分类的词性标注器

分类是为给定输入选择正确的类标签的任务。比如判断一封Email是否是垃圾邮件,确定一篇新闻的主题。 如果分类需要人工标准的标签进行训练,则称为有监督分类。 特征是一个非常重要的概念。使用分类器首先要决定选择什么 样的特征,以及对特征进行编码。如果没有特征直接输入原始数据,则数据会十分离散而难以训...

2017-08-17 17:09:54

阅读数 6296

评论数 0

原创 NLTK学习之二:建构词性标注器

自然语言是人类在沟通中形成的一套规则体系。规则有强有弱,比如非正式场合使用口语,正式场合下的书面语。要处理自然语言,也要遵循这些形成的规则,否则就会得出令人无法理解的结论。

2017-08-14 18:30:16

阅读数 5385

评论数 0

原创 NLTK学习之一:简单文本分析

nltk的全称是natural language toolkit,是一套基于python的自然语言处理工具集。1 NLTK的安装nltk的安装十分便捷,只需要pip就可以。pip install nltk在nltk中集成了语料与模型等的包管理器,通过在python解释器中执行>>>...

2017-08-13 21:09:07

阅读数 48136

评论数 6

原创 Keras学习之六:训练辅助及优化工具

对Keras提供的一些训练辅助工具类进行介绍

2017-08-02 18:06:58

阅读数 6992

评论数 0

原创 keras学习之五:Keras中的神经网络层组件简介

对Keras提供的对各种层的抽象进行相对全面的概括,以对Keras有更全面的认识。

2017-08-02 18:03:40

阅读数 7412

评论数 0

原创 Keras学习之四:用RNN进行评论好恶预测

RNN即循环神经网络,其主要用途是处理和预测序列数据。在CNN中,神经网络层间采用全连接的方式连接,但层内节点之间却无连接。RNN为了处理序列数据,层内节点的输出还会重新输入本层,以实现学习历史,预测未来。 RNN的两个主要改进是LSTM(长短时记忆网络)和GRU(门控循环单元),二者为基本神经...

2017-08-02 17:40:43

阅读数 5590

评论数 7

提示
确定要删除当前文章?
取消 删除