自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI小白入门的博客

专注自然语言处理、机器学习、人工智能领域学习与研究

  • 博客(23)
  • 资源 (1)
  • 收藏
  • 关注

原创 Windows下JDK环境配置

去官网下载JDK 官网地址:http://www.oracle.com/technetwork/java/index.html window x64是64位的,64位机器下载这个。下载之后直接点击安装就行了,安装完了之后会跳出一个页面让你再安装jre,JRE是Java的运行环境,包括了JVM等一些Java的运行环境。这里可以选择安装,也可以不安装,因为在我们安装的JDK里面已经有了JRE了。2.

2017-07-26 17:16:43 1483

原创 NLP期刊

自然语言处理(natural language processing,NLP)在很大程度上与计算语言学(computational linguistics,CL)重合。NLP/CL有一个属于自己的最权威的国际专业学会,叫做The Association for Computational Linguistics(ACL,URL:http://aclweb.org/),这个协会主办了NLP/CL领域最

2017-07-24 10:54:23 12894 2

原创 RNN学习笔记以及LSTM详解

RNNRNN介绍RNN的目的使用来处理序列数据。在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如,你要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独立的。RNN之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行

2017-07-18 15:39:49 9499 2

原创 Windows下安装scipy

SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包.它包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等.但是直接使用pip install scipy下载失败。 直接使用pip install安装需要电脑安装有C编译器,更为简单的方式是下载预编译的包,具体过程如下: 1.在网页中 http://www.lfd.uci.edu/~gohlke

2017-07-15 18:42:33 1934

原创 Tensorflow-CNN学习以及实现

代码参数解释卷积操作tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)input:待卷积的数据。格式要求为一个张量,[batch, in_height, in_width, in_channels]. 分别表示 批次数,图像高度,宽度,输入通道数。 filter:...

2017-07-15 13:51:22 1563

原创 CNN学习笔记

介绍卷积神经网络是人工神经网络的一种,已成为当前语音分析和图像识别领域的研究热点。它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。该优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。卷积网络是为识别二维形状而特殊设计的一个多层感知器,这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具

2017-07-15 13:45:04 1661

原创 Tensorflow-多层感知机学习与实现

多层感知器(Multilayer Perceptron,缩写MLP)是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。MLP可以被看作是一个有向图,由多个的节点层所组成,每一层都全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元(或称处理单元)。一种被称为反向传播算法的监督学习方法常被用来训练MLP。MLP是感知器的推广,克服了感知器不能对线性不可分数据进行识别的弱

2017-07-15 10:04:23 2515

原创 机器学习

机器学习是人工智能的一个分支。人工智能的研究是从以“推理”为重点到以“知识”为重点,再到以“学习”为重点,一条自然、清晰的脉络。显然,机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习在近30多年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从

2017-07-14 12:39:25 1709

原创 Tensorflow--实现KNN

KNN(k最近邻) K最近邻(K-Nearest Neighbor,KNN)算法,是著名的模式识别统计学方法,在机器学习分类算法中占有相当大的地位。它是一个理论上比较成熟的方法。既是最简单的机器学习算法之一,也是基于实例的学习方法中最基本的,也是常见的文本分类算法之一。基本思想 如果一个实例在特征空间中的K个最相似(即特征空间中最近邻)的实例中的大多数属于某一个类别,则该实例也属于这个类别。所选

2017-07-12 16:00:18 5081 2

原创 Tensorflow Windows下安装

官网提供二种windows下安装tensorflow方法 1.anaconda安装 2.pip本地安装Anaconda下载地址:https://repo.continuum.io/archive/Anaconda只能下载一个版本的python,比如最新的Anaconda 4.4,只能下载python3.6和python2.7的版本。而且tensorflow 只对python3.5支持较好,所以得

2017-07-12 13:15:30 6680

原创 文本摘要

自动文摘出现的重要原因之一是信息过载问题。自动文摘要解决的问题描述很简单,就是用一些精炼的话来概括整篇文章的大意。目前有二种流派,一种是extractive,抽取式的,从原文中找到一些关键的句子,组合成一篇摘要;另外一种是abstractive,摘要式的,这需要计算机可以读懂原文的内容,并且用自己的意思将其表达出来。人类语言包括字、词、短语、句子、段落、文档这几个level,研究难度依次递增,理解句

2017-07-11 00:17:05 2246

原创 TextRank: Bringing Order into Texts阅读笔记

本文介绍了TextRank - 一种基于图形的文本处理排名模型,并展示了如何在自然语言应用程序中成功使用该模型。 文章提出了关键词和句子提取两种创新的无监督方法,并且表明所获得的结果与先前公认的已建立基准测试结果相比有提升。基于图的排序算法本质上是基于从整个图形递归绘制的全局信息来决定图中顶点的重要性的方式。 基于图的排名模式实现的基本思想是“投票”或“推荐”。 当一个顶点链接到另一个顶点时,它基本

2017-07-10 17:51:06 3710

原创 Tensorflow-MNIST入门实例

MNIST是一个简单的计算机视觉数据集。 它由像这样的手写数字的图像组成: 它还包括每个图像的标签,告诉我们是哪个数字。 例如,上述图像的标签是5,0,4和1。我们将训练一个模型来查看图像并预测它们的数字。MNIST 数据集: 数据集下载地址:http://yann.lecun.com/exdb/mnist/MNIST数据分为三部分:训练数据(mnist.train)55,000个数据点,1

2017-07-10 10:56:41 4478

原创 Tensorflow-简单的例子

TensorFlow提供了优化器,可以缓慢地更改每个变量,以便最小化损失函数。最简单的优化器是梯度下降。它根据相对于该变量的损失导数的大小修改每个变量。通常,手动计算符号导数是冗长乏味且容易出错的。因此,TensorFlow可以使用函数tf.gradients自动生成仅给出模型描述的导数。为了简单起见,优化器通常为您做这个。例如optimizer = tf.train.GradientDescent

2017-07-10 09:54:19 11376

原创 使用fastText进行文本分类

fastText文本分类学习笔记文本分类,linux命令行: ./fasttext supervised -input train.txt -output model训练集train.txt的输入格式为: 标签是以字符串label作为前缀的单词,后面的数字对应类别。一旦模型被训练,您可以通过使用以下方法计算测试集上的k的精度和召回率来对其进行评估:$ ./fasttext test mode

2017-07-10 01:10:26 6206

原创 python 2.X与python 3.X共存

Python搭建非常简单,但是python有二本版本,python2和python3,但是由于一些python包用于2.X版本,而一些python包只能用于python 3.X的版本。对于我这种入门级菜鸟,如果想同时在一台电脑上即使用2.x 和3.X版本,就显得很无奈了。我的电脑首先安装了python2.7 这次我想使用tensorflow,而tensorflow只能在python3.X下,所以

2017-07-09 16:53:39 1827

原创 Tensorflow-基本操作基本知识

基本知识: 使用 TensorFlow, 必须明白 TensorFlow: 使用图 (graph) 来表示计算任务. 在被称之为 会话 (Session) 的上下文 (context) 中执行图. 使用 tensor 表示数据.(数据表示成张量) 通过 变量 (Variable) 维护状态. 使用 feed 和 fetch 可以为任意的操作(arbitrary operation) 赋...

2017-07-08 10:38:50 1507

原创 Stanford Log-linear Part-Of-Speech Tagger学习

主页:https://nlp.stanford.edu/software/tagger.html下载: basic English Stanford Tagger version 只包括训练好的英文模型,而 full Stanford Tagger version 包括多种语言模型,其中有英文,中文,德语等模型。一个简单的Demo:import java.io.IOException; imp

2017-07-03 20:38:19 2343

原创 词性标注

词性标注(Part-of-Speech tagging 或POS tagging),又称词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容词或其他词性的过程。词性标注是自然语言处理的一个基本任务。词性标注现在有基于很多语言的实现,其中包括stanford开源的实现,还有python NLTK的实现。

2017-07-03 20:29:36 1823

原创 Stanford NER学习笔记

Stanford NER是一款斯坦福大学开源的命名实体类识别工具,此工具java实现。主页地址:https://nlp.stanford.edu/software/CRF-NER.html介绍: Stanford NER是一个斯坦福大学开源的命名实体类识别工具,基于Java实现。Stanford NER也被称为CRFClassifier。该软件提供(任意顺序)线性链条件随机场(CRF)序列模型的

2017-07-03 20:05:13 3987 2

原创 命名实体类

什么是命名实体识别:命名实体识别是将文本中的元素分成预先定义的类,如人名、地名、 机构名、时间、货币等等。作为自然语言的承载信息单位,命名实体识别 属于文本信息处理的基础的研究领域,是信息抽取、信息检索、机器翻译、 问答系统等多种自然语言处理技术中必不可少的组成部分。传统的 NER 任务主要是对七大类的识别:命名实体识别主要分类,一般包括 3 大类(实体类、时间类和数字类)和 7 小类(人名、地名、

2017-07-03 00:32:39 2953

原创 关系抽取学习笔记

什么是关系抽取: 关系抽取式从文本中抽取特定的关系,以及具有这种关系的实体。 目前将关系抽取划分为两个阶段研究:特定领域的传统关系抽取和开放领域的关系抽取。关系抽取数据集: ACE04,05,SemEval Task8,openIE关系抽取经典的方法和应用:目前远程监督的方法比较占优,除了远程监督之外还有二种常见的,一种是 Bootstrapping,代表系统是 NELL,还

2017-07-03 00:28:57 5617 1

原创 NYOJ:79-拦截导弹

拦截导弹 时间限制:3000 ms | 内存限制:65535 KB 难度:3描述 某国为了防御敌国的导弹袭击,发展中一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷:虽然它的第一发炮弹能够到达任意的高度,但是以后每一发炮弹都不能高于等于前一发的高度。某天,雷达捕捉到敌国导弹来袭。由于该系统还在试用阶段,所以只用一套系统,因此有可能不能拦截所有的导弹。输入 第一行输入测试数据组数N(1

2017-07-01 00:02:37 1380

《Java 基础入门(传智播客出品)》高清

文件为Java基础入门书籍,由传智播客出品,相当适合新手入门学习java

2018-03-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除