Tensorflow-OP
bo.qiu_xbw
Talking is cheap ,show me the code.
展开
-
tensorflow savemodel与pb(ckpt)互相转换
ckpt ------> save_modelimport tensorflow as tfimport sys trained_checkpoint_prefix = sys.argv[1]export_dir = sys.argv[2]graph = tf.Graph()config=tf.ConfigProto(allow_soft_placement=True, log_device_placement=True)with tf.compat.v1.Session(gra原创 2021-11-02 11:21:16 · 4565 阅读 · 0 评论 -
BERT encoder-attention计算逻辑
encoder中最重要的莫过于attention的计算了,本章对照代码讲解一下计算逻辑,主要是python改成c++时候要注意一些shape,并且减少tanspose的使用,使用Intel mkl中的矩阵计算API,例如cblas,cblas_batch等等。1.qkv合并------>Dense(input * qkv_weight + qkv_bias)------->split分开分开后q=k=v shape为(batch_size, seq_len, number_of_head,原创 2021-09-29 13:55:40 · 556 阅读 · 0 评论 -
vscode使用gdb调试c++代码
在工程项目中有一个名字为.vscode的文件夹,文件夹内部有一个launch.json的文件。{ "envFile": "${workspaceFolder}/.env", "name": "g++ - debug custom xxx(.cpp后缀不用写)", "type": "cppdbg", "request": "launch", "program": "${workspaceF原创 2021-09-28 15:19:04 · 765 阅读 · 0 评论 -
c++ 多线程加速OPM库的使用
c++中往往需要使用for循环,嵌套for循环得速度就更加慢了。需要使用Openmp多线程进行加速。https://blog.csdn.net/weixin_39568744/article/details/88576576这个博客讲的非常仔细,本文主要是记录一下工作上的一些使用1.告诉编辑器下面使用for循环#pragma omp parallel for2.在OpenMP 3.0中,可以利用collapse指令来解决循环嵌套问题,#pragma omp parallel for co原创 2021-09-17 17:28:59 · 852 阅读 · 0 评论 -
TensorFlow Identity讲解
https://blog.csdn.net/qq_23981335/article/details/81361748?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-5.no_search_link&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommend原创 2021-09-09 23:20:27 · 137 阅读 · 0 评论 -
Tensorflow 静态图PB模型修改(OP修改)
def load_pb_graph(path): with tf.gfile.GFile(path, "rb") as f: graph_def = tf.GraphDef() graph_def.ParseFromString(f.read()) with tf.Graph().as_default() as g: tf.import_graph_def(graph_def, name=None) return gmodel_f原创 2021-09-09 21:35:14 · 1251 阅读 · 0 评论