2018年09月_小杨算法屋

原创 tf.nn.dropout()的用法

tf.nn.dropout()是tensorflow里面为了防止或减轻过拟合而使用的函数，它一般用在全连接层Dropout就是在不同的训练过程中随机扔掉一部分神经元。也就是让某个神经元的激活值以一定的概率p，让其停止工作，这次训练过程中不更新权值，也不参加神经网络的计算。但是它的权重得保留下来（只是暂时不更新而已），因为下次样本输入时它可能又得工作了tf.nn.dropout函数说明...

2018-09-30 16:39:21 61707 18

原创 tf.nn.embedding_lookup()的用法

函数：tf.nn.embedding_lookup( params, ids, partition_strategy='mod', name=None, validate_indices=True, max_...

2018-09-30 16:17:07 32442 2

原创 tf.nn.l2_loss()的用法

l2_loss()这个函数的作用是利用L2范数来计算张量的误差值，但是没有开发并且只取L2范数的值的一半函数：tf.nn.l2_loss( t, name=None)参数：t：一个张量(tensor)，类型可以为：half, bfloat16, float32, float64name：op的一个名字，即为这个操作取个名字作用：不使用sqrt计算张量...

2018-09-30 15:53:52 34897 5

原创 tf.contrib.crf.crf_log_likelihood()的用法

函数：tf.contrib.crf.crf_log_likelihood(inputs, tag_indices, sequence_lengths, transition_params=None)在一个条件随机场里面计算标签序列的log-likelihood，函数的目的是使用crf来计算损失，里面用到最大似然估计的优化方法参数：inputs: 一个形状为[batch_size,...

2018-09-30 14:59:28 7616

转载基于深度学习的命名实体识别详解（附Github代码）

命名实体识别（NER）是在自然语言处理中的一个经典问题，其应用也极为广泛。比如从一句话中识别出人名、地名，从电商的搜索中识别出产品的名字，识别药物名称等等。传统的公认比较好的处理算法是条件随机场（CRF），它是一种判别式概率模型，是随机场的一种，常用于标注或分析序列资料，如自然语言文字或是生物序列。简单是说在NER中应用是，给定一系列的特...

2018-09-27 14:32:03 5698 1

转载深度学习-超参数调整总结

在深度神经网络中，超参数的调整是一项必备技能，通过观察在训练过程中的监测指标如损失loss和准确率来判断当前模型处于什么样的训练状态，及时调整超参数以更科学地训练模型能够提高资源利用率。在本研究中使用了以下超参数，下面将分别介绍并总结了不同超参数的调整规则。（1）学习率学习率（learning rate或作lr）是指在优化算法中更新网络权重的幅度大小。学习率可以是恒定的、逐渐降低的，基于动...

2018-09-26 16:41:23 3064

作用：在复杂的问题中，网络往往都是很复杂的，为了方便调试参数以及调整网络结构，我们需要将计算图可视化出来，以便能够更好的进行下一步的决策。tensorboard是可视化tensorflow模型的训练过程的工具，在安装tensorflow的同时就已经安装好了tensorboard。tensorboard能够有效地展示tensorflow在运行过程中的计算图、各种指标随着时间的变化趋势以及训练中使...

2018-09-26 16:15:45 26881 5

原创 CNN文本分类

文本分类是NLP领域的一个重要的子任务，文本分类的目标是自动的将文本打上已经定义好的标签，常见的文本分类任务有：垃圾邮件过滤、情感分析、新闻分类等等。代码是来自https://github.com/gaussic/text-classification-cnn-rnn大家可以自行下载阅读，下面仅仅是自己对代码的一个解读，仅此而已，若有不合适的地方，希望大家多多指出，共同交流1、任务...

2018-09-20 08:33:46 7905 10

原创 SPARQL查询RDF文件-2

1、查询语句包括查询信息以及名称应该符合的条件，条件以三元组形式出现，按照<subject,predicate,object>（主谓宾）的顺序排列，查询条件也成为一个模式(Pattern)，查询的结果实际就是条件三元组与数据文件(或RDF图)中RDF三元组匹配的结果2、语句中的?加一个字母表示该字母是一个变量，比如?x，在select后面的变量会显示在查询结果中，作为列名称出现...

2018-09-12 17:50:32 874

原创 replace函数在python2中编码格式的转换

在python2版本中处理字符串时，经常能遇到的问题就是编码格式问题，一不小心就会遇到问题今天偶然间发现replace()函数可以将字符串的编码格式进行更改，具体的代码如下所示：>>> a = 'hello a'>>> print type(a)<type 'str'>>>> b = u'hello b'>&...

2018-09-12 16:19:58 1565

转载 RDF-重要词汇解释-RDF系列学习-3

网址来源：https://blog.csdn.net/littleorange6/article/details/775128231、四大常量及其关系（1）class（2）resource（3）property（4）literal这个class是所有具体的class的个父类。比如动物类，植物类都是class的子类。同样的，这四大常量也都是class的子类。而一切所有皆资...

2018-09-12 11:22:44 1009

转载 RDF容器元素-RDF系列学习-2

RDF容器用于描述一组事物，如将一本书的所有作者列在一起值有可能不是一个，而是一系列。比如，一堂课的授课教师可能是很多个。这时，他们的可以用容器表示。1. rdf: Bag 无序容器2. rdf: Seq 有序容器3. rdf: Alt 多选一<Bag>、<Seq> 以及 <Alt>这些的 RDF 元素可以用于描述这些的组（1）<r...

2018-09-12 11:20:44 780

原创 neo4j建立知识图谱-快乐家族

最近在研究知识图谱的东西，也在之前的博客中介绍过直接使用cypher进行建立知识图谱，今天又实践了一下怎样在python中使用cypher语言进行知识图谱的构建，网上这方面的资料也比较少，特此分享给大家，内容比较简单哦原则：1）cypher用于数据的更新和查询2）一个cypher语句不能同时查询和更新3）label没有属性4）relationship：有方向、有类型命名规范：1）实...

2018-09-08 14:09:59 18483 23

原创 gensim中doc2vec计算文本相似度

最近在做判断两个文本是否是描述的同一件事情，之前是采用gensim中的TF-IDF进行计算的，TF-IDF这种方法没有考虑到文字背后的语义关联，可能在两个文档共同出现的单词很少甚至没有相同的单词，但两个文档是相似的情况下，就需要考虑到文档的语义。我们都知道word2vec是可以分析语义的，那么doc2vec是不是也可以分析出语义呢？于是试了一下gensim中的doc2vec。Doc2Vec也...

2018-09-06 17:14:20 12846 1

转载 gensim做主题模型

#coding:utf-8import jiebafrom gensim import corpora,models,similaritiesfrom jieba import analyse##引用TF-IDF关键词抽取接口tfidf = analyse.extract_tags##keywords = jieba.analyse.extract_tags(str1, topK=...

2018-09-05 14:20:40 1217

原创 gensim中word2vec训练向量

当我们训练神经网络时，输入数据有时是训练好的词向量，有时是字向量，我们自己训练训练向量时，可以借用gensim中的word2vec，下面的代码可以同时实现词向量、字向量的训练from gensim.models import Word2Vecimport osimport jiebadef h1():##该函数主要是对语料的前期处理，可以根据不同的情况进行修改 path1 =...

2018-09-04 15:53:13 2004 1

原创 tensorflow系列学习-1

1）使用图来表示计算任务2）在被称之为会话的上下文中执行图3）使用tensor表示数据4）通过变量维护状态5）使用feed和fetch可以为任意的操作赋值或者从其中获取数据tensoflow是一个编程系统，使用图表示计算任务，图中的节点称之为op，一个op获得0个或多个tensor，执行计算，产生0个或多个tensor,tensor看作是一个n维的数组或列表，图必须在会话里被启动#...

2018-09-03 19:31:09 209

摆渡者