- 博客(17)
- 资源 (1)
- 收藏
- 关注
原创 tf.nn.dropout()的用法
tf.nn.dropout()是tensorflow里面为了防止或减轻过拟合而使用的函数,它一般用在全连接层Dropout就是在不同的训练过程中随机扔掉一部分神经元。也就是让某个神经元的激活值以一定的概率p,让其停止工作,这次训练过程中不更新权值,也不参加神经网络的计算。但是它的权重得保留下来(只是暂时不更新而已),因为下次样本输入时它可能又得工作了tf.nn.dropout函数说明...
2018-09-30 16:39:21 61707 18
原创 tf.nn.embedding_lookup()的用法
函数:tf.nn.embedding_lookup( params, ids, partition_strategy='mod', name=None, validate_indices=True, max_...
2018-09-30 16:17:07 32442 2
原创 tf.nn.l2_loss()的用法
l2_loss()这个函数的作用是利用L2范数来计算张量的误差值,但是没有开发并且只取L2范数的值的一半函数:tf.nn.l2_loss( t, name=None)参数:t:一个张量(tensor),类型可以为:half, bfloat16, float32, float64name:op的一个名字,即为这个操作取个名字作用:不使用sqrt计算张量...
2018-09-30 15:53:52 34897 5
原创 tf.contrib.crf.crf_log_likelihood()的用法
函数:tf.contrib.crf.crf_log_likelihood(inputs, tag_indices, sequence_lengths, transition_params=None)在一个条件随机场里面计算标签序列的log-likelihood,函数的目的是使用crf来计算损失,里面用到最大似然估计的优化方法参数:inputs: 一个形状为[batch_size,...
2018-09-30 14:59:28 7616
转载 基于深度学习的命名实体识别详解(附Github代码)
命名实体识别(NER)是在自然语言处理中的一个经典问题,其应用也极为广泛。比如从一句话中识别出人名、地名,从电商的搜索中识别出产品的名字,识别药物名称等等。传统的公认比较好的处理算法是条件随机场(CRF),它是一种判别式概率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列。简单是说在NER中应用是,给定一系列的特...
2018-09-27 14:32:03 5698 1
转载 深度学习-超参数调整总结
在深度神经网络中,超参数的调整是一项必备技能,通过观察在训练过程中的监测指标如损失loss和准确率来判断当前模型处于什么样的训练状态,及时调整超参数以更科学地训练模型能够提高资源利用率。在本研究中使用了以下超参数,下面将分别介绍并总结了不同超参数的调整规则。(1)学习率学习率(learning rate或作lr)是指在优化算法中更新网络权重的幅度大小。学习率可以是恒定的、逐渐降低的,基于动...
2018-09-26 16:41:23 3064
原创 tensorboard的使用
作用:在复杂的问题中,网络往往都是很复杂的,为了方便调试参数以及调整网络结构,我们需要将计算图可视化出来,以便能够更好的进行下一步的决策。tensorboard是可视化tensorflow模型的训练过程的工具,在安装tensorflow的同时就已经安装好了tensorboard。tensorboard能够有效地展示tensorflow在运行过程中的计算图、各种指标随着时间的变化趋势以及训练中使...
2018-09-26 16:15:45 26881 5
原创 CNN文本分类
文本分类是NLP领域的一个重要的子任务,文本分类的目标是自动的将文本打上已经定义好的标签,常见的文本分类任务有:垃圾邮件过滤、情感分析、新闻分类等等。代码是来自https://github.com/gaussic/text-classification-cnn-rnn大家可以自行下载阅读,下面仅仅是自己对代码的一个解读,仅此而已,若有不合适的地方,希望大家多多指出,共同交流1、任务...
2018-09-20 08:33:46 7905 10
原创 SPARQL查询RDF文件-2
1、查询语句包括查询信息以及名称应该符合的条件,条件以三元组形式出现,按照<subject,predicate,object>(主谓宾)的顺序排列,查询条件也成为一个模式(Pattern),查询的结果实际就是条件三元组与数据文件(或RDF图)中RDF三元组匹配的结果2、语句中的?加一个字母表示该字母是一个变量,比如?x,在select后面的变量会显示在查询结果中,作为列名称出现...
2018-09-12 17:50:32 874
原创 replace函数在python2中编码格式的转换
在python2版本中处理字符串时,经常能遇到的问题就是编码格式问题,一不小心就会遇到问题今天偶然间发现replace()函数可以将字符串的编码格式进行更改,具体的代码如下所示:>>> a = 'hello a'>>> print type(a)<type 'str'>>>> b = u'hello b'>&...
2018-09-12 16:19:58 1565
转载 RDF-重要词汇解释-RDF系列学习-3
网址来源:https://blog.csdn.net/littleorange6/article/details/775128231、四大常量及其关系(1)class(2)resource(3)property(4)literal这个class是所有具体的class的个父类。比如动物类,植物类都是class的子类。同样的,这四大常量也都是class的子类。而一切所有皆资...
2018-09-12 11:22:44 1009
转载 RDF容器元素-RDF系列学习-2
RDF容器用于描述一组事物,如将一本书的所有作者列在一起值有可能不是一个,而是一系列。比如,一堂课的授课教师可能是很多个。这时,他们的可以用容器表示。1. rdf: Bag 无序容器2. rdf: Seq 有序容器3. rdf: Alt 多选一<Bag>、<Seq> 以及 <Alt>这些的 RDF 元素可以用于描述这些的组(1)<r...
2018-09-12 11:20:44 780
原创 neo4j建立知识图谱-快乐家族
最近在研究知识图谱的东西,也在之前的博客中介绍过直接使用cypher进行建立知识图谱,今天又实践了一下怎样在python中使用cypher语言进行知识图谱的构建,网上这方面的资料也比较少,特此分享给大家,内容比较简单哦原则:1)cypher用于数据的更新和查询2)一个cypher语句不能同时查询和更新3)label没有属性4)relationship:有方向、有类型命名规范:1)实...
2018-09-08 14:09:59 18483 23
原创 gensim中doc2vec计算文本相似度
最近在做判断两个文本是否是描述的同一件事情,之前是采用gensim中的TF-IDF进行计算的,TF-IDF这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有相同的单词,但两个文档是相似的情况下,就需要考虑到文档的语义。我们都知道word2vec是可以分析语义的,那么doc2vec是不是也可以分析出语义呢?于是试了一下gensim中的doc2vec。Doc2Vec也...
2018-09-06 17:14:20 12846 1
转载 gensim做主题模型
#coding:utf-8import jiebafrom gensim import corpora,models,similaritiesfrom jieba import analyse##引用TF-IDF关键词抽取接口tfidf = analyse.extract_tags##keywords = jieba.analyse.extract_tags(str1, topK=...
2018-09-05 14:20:40 1217
原创 gensim中word2vec训练向量
当我们训练神经网络时,输入数据有时是训练好的词向量,有时是字向量,我们自己训练训练向量时,可以借用gensim中的word2vec,下面的代码可以同时实现词向量、字向量的训练from gensim.models import Word2Vecimport osimport jiebadef h1():##该函数主要是对语料的前期处理,可以根据不同的情况进行修改 path1 =...
2018-09-04 15:53:13 2004 1
原创 tensorflow系列学习-1
1)使用图来表示计算任务2)在被称之为会话的上下文中执行图3)使用tensor表示数据4)通过变量维护状态5)使用feed和fetch可以为任意的操作赋值或者从其中获取数据tensoflow是一个编程系统,使用图表示计算任务,图中的节点称之为op,一个op获得0个或多个tensor,执行计算,产生0个或多个tensor,tensor看作是一个n维的数组或列表,图必须在会话里被启动#...
2018-09-03 19:31:09 209
中文句子向量生成代码
2018-12-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人