tensorflow
文章平均质量分 95
fkyyly
这个作者很懒,什么都没留下…
展开
-
TensorFlow模型保存和载入方法汇总
目录一、TensorFlow常规模型加载方法 保存模型 加载模型 1.不加载图结构,只加载参数 2.加载图结构和参数 3.简化版本 二、TensorFlow二进制模型加载方法 三、二进制模型制作 四、从图上读取张量 从二进制模型加载张量 从当前图中获取对应张量 从图中获取节点信息 『TensorFlow』第七弹_保存&载入会话_霸王回马回到顶部一、TensorFlow常规模型加载方法保存模型tf.train.Saver...转载 2021-01-21 15:10:53 · 386 阅读 · 0 评论 -
tensorflow全链接层
1 denselogits = tf.layers.dense(sent_feature, clf_params["class_num"], name="softmax")2 matmul和biashidden_size = output_layer.shape[-1].valueoutput_weights = tf.get_variable( "output_weights", .原创 2020-09-11 19:37:06 · 194 阅读 · 0 评论 -
tensorflow中的loss函数总结
回归和分类是监督学习中的两个大类。自学过程中,阅读别人代码时经常看到不同种类的损失函数,到底 Tensorflow 中有多少自带的损失函数呢,什么情况下使用什么样的损失函数?这次就来汇总介绍一下。一、处理回归问题1. tf.losses.mean_squared_error:均方根误差(MSE) —— 回归问题中最常用的损失函数优点是便于梯度下降,误差大时下降快,误差小时下降慢,有利于函数收敛。缺点是受明显偏离正常范围的离群样本的影响较大# Tensorflow中集成的函数mse =转载 2020-09-01 14:50:12 · 4280 阅读 · 0 评论 -
word2vec and fasttext操作
1 word2vec训练#coding=utf-8import jiebaimport jieba.posseg as psegimport smart_openimport xlrdimport codecsfrom gensim.models import Word2Vec# 读文件def read_file(): jieba.load_userdict("dic.txt") user_query_segment_list = [] with open("原创 2020-08-21 23:27:41 · 437 阅读 · 0 评论 -
tensorflow bug
1 ValueError: An initializer for variable kernel of type <dtype: 'string'> is检查下word embedding的dtype,看是否是float32原创 2020-08-07 14:51:43 · 260 阅读 · 1 评论 -
tensorflwow pytorch 控制gpu使用量指令
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.333)TensorFlow设置GPU占用量:https://www.cnblogs.com/jiu0821/p/9501665.html1 pytorch设置GPU占用量的指令是哪个?(未解决,)是这个p['momentum'] =0.9么?不是,这个是动量帮助训...转载 2020-04-05 16:35:29 · 1034 阅读 · 0 评论 -
tensorflow loss为nan 梯度截断
global_step = tf.Variable(0, trainable=False)learning_rate = tf.train.exponential_decay(config.base_learning_rate, global_step, decay_steps=config.decay_st...原创 2019-12-10 23:49:38 · 521 阅读 · 0 评论 -
tensorflow model转为pb文件以及python调用
1 模型转pb# coding=utf-8from tensorflow.contrib.saved_model.python.saved_model.utils import simple_savefrom options import Optionsfrom data_provider import *from collections import Counter, defau...原创 2019-09-05 22:07:34 · 2633 阅读 · 2 评论 -
keras2tensorflow
keras模型文件转化为tensorflow的pb文件,然后java调用from keras.models import load_modelfrom keras import backend as Kfrom keras.models import model_from_configimport tensorflow as tfmodel = load_model('mode...原创 2019-05-07 11:18:06 · 442 阅读 · 0 评论 -
highway
(1)y是input,g(wy+b)是输出t = sigmoid(Wy + b)z = t * g(Wy + b) + (1 - t) * ywhere g is nonlinearity, t is transform gate, and (1 - t) is carry gate.(2)文章 http://arxiv.org/abs/1505.00387参考代码https://git...原创 2018-08-21 22:23:33 · 584 阅读 · 2 评论 -
tensorflow流程
1 数据和预处理2 确定模型结构3 实现模型3.1 输入占位符3.2 向量层 emberding3.3 卷积层和池化层3.4 Dropout 层3.5 score和predict3.6 loss 和 Accuracy3.7 可视化网络 tensorboard4 train4.1 实例化模型并尽可能减少损失(优化器,梯度的计算)4.2 Summarie原创 2018-01-14 22:13:43 · 645 阅读 · 0 评论 -
tensorflow API注意点
(1)tf.nn.conv2d 和 tf.layers.conv2d功能相同都可以使用tf.layers.conv2d 使用tf.nn.convolution作为后端https://blog.csdn.net/wanglitao588/article/details/77162351原创 2018-07-04 00:06:31 · 226 阅读 · 0 评论 -
tensorflow优化器
GradientDescentOptimizer AdagradOptimizer AdagradDAOptimizer MomentumOptimizer AdamOptimizer FtrlOptimizer RMSPropOptimizerhttps://blog.csdn.net/luo123n/article/details/48239963https://blog.csdn.net/w...转载 2018-07-04 00:06:49 · 201 阅读 · 0 评论 -
tensorflow强制使用CPU
Keras如果是使用Theano后端的话,应该是自动不使用GPU只是用CPU的,启动GPU使用Theano内部命令即可。对于Tensorflow后端的Keras以及Tensorflow会自动使用可见的GPU,而我需要其必须只运行在CPU上。网上查到三种方法,最后一种比较方便:使用tensorflow的with tf.device('/cpu:0'):函数。简单操作就是把所有命令都放在前面...转载 2018-07-09 01:31:12 · 11028 阅读 · 0 评论 -
seq2seq主要实现步骤和源码
注意点:1 数据预处理阶段(添加特殊字符)<PAD>主要用来进行字符补全,<EOS>和<GO>都是用在Decoder端的序列中,告诉解码器句子的起始与结束<UNK>则用来替代一些未出现过的词或者低频词2 encoder直接lstm或者其他模型3 decoder对target数据进行处理 构造Decoder 在训练过程...原创 2018-08-05 21:46:16 · 3890 阅读 · 1 评论 -
batch normalization
1 为什么要batch normalization(1)如下图值较大的feature,如果feature变化的话,导致结果变化的比较多。也就是该feature方向斜率较大应该做归一化,尽量使数据正圆(2)如果不归一化,每个feature方向的learning rate不同(3) 归一化train_featues = chinese_data_helpers.load_fea...原创 2018-08-06 21:21:31 · 222 阅读 · 0 评论 -
tensorflow基本术语解释
计算图、tensor、节点、操作、常量、变量,以及占位符整体流程1 计算图、tensor、节点、操作TensorFlow是一个采用数据流图,用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。TensorFlow的核心编程可以分解为两个离散的部分:构建计算图执行计算图计算原创 2018-01-14 19:45:12 · 1394 阅读 · 0 评论