c3255-CSDN博客

原创腾讯面试总结

从开始报腾讯的暑期实习开发岗开始算起，第三天晚上就突然收到了面试的电话，那两天正在忙于复习数据结构、和网络的知识，面试的自我介绍都没有准备。没办法接到电话的那一刻只能硬着头皮上了。果然，一开始就先做个自我介绍，我只能把我目前做过的项目，学校都介绍了一下。然后面试官又详细的问了我的实习项目，感觉他对我做的深度学习的项目很感兴趣，问了我对tensorflow的理解，和用过什么函数之类的知...

2019-03-27 09:48:59 423

原创解决nvprof工具使用报错的问题

今天编译了个算矩阵相乘的程序，想用nvprof工具来分析kernel的运行状况。输入nvprof ./matrix.out结果报错======== Error: unified memory profiling failed.改为 nvprof --unified-memory-profiling off ./matrix.out 成功！...

2018-09-09 17:37:44 2390

原创 tensorflow添加自定义OP（GPU版本）

今天试了下注册GPU支持的OP。 GPU内核 GPU内核分两部分实现：OpKernel和CUDA内核及其启动代码。有时OpKernel的实现在CPU和GPU内核之间很常见，比如检查输入和分配输出。在这种情况下，建议的实施是：定义在Device上模板化的OpKernel和张量的基本类型。为了完成输出的实际计算，Compute函数调用模板函子结构。该函数对CPUDevice的专门化定...

2018-09-08 15:53:04 3326 5

转载 tensorflow创建动态库文件来自定义op

目前正在学习tensorflow自定义OP，刚学会如何添加和添加简单的op代码。预备技能对 C++ 有一定了解. 已经下载 TensorFlow 源代码并有能力编译它.第一步:找一个文件夹存放你要编译的文件my_add.cc并调用 REGISTER_OP 宏来定义 Op 的接口. 该OP接受两个int32 类型tensor 作为输入,并将这两个tensor进行求和并将第一位置0输...

2018-09-07 10:02:46 1734 2

今天试了一下tensorflow自定义op，在tensorflow源代码下创建一个自己的op后需要重新编译tensorflow，但是我这次编译出现了如下所示的错误： ERROR: /home/torstein/.cache/bazel/_bazel_torstein/1f82ba256daa7468e9c0a1514e0b9aa5/external/local_config_python/BUI...

2018-09-05 10:49:52 1892

原创 ubuntu16.04下tensorflow-GPU源代码安装教程

本文主要讲如何使用ubuntu16.04系统源代码编译tensor flow-GPU。电脑配置； CPU：i5-5700 GPU：GT-730 内存：16G 我参考了网上很多教程，总结出了自己的一套tensorflow源代码编译的方法。废话不多说现在开始。 1. 如果你想要安装tensorflow-GPU版本首先得确定你电脑的显卡是否支持CUDA，一般来说必须是6系含以上级别的显卡...

2018-09-04 16:36:13 843

c3255的博客

原创腾讯面试总结

原创解决nvprof工具使用报错的问题

原创 tensorflow添加自定义OP（GPU版本）

转载 tensorflow创建动态库文件来自定义op

原创重新编译tensorflow源代码遇见的问题解决方法

原创 ubuntu16.04下tensorflow-GPU源代码安装教程

空空如也

空空如也

原创 腾讯面试总结

原创 解决nvprof工具使用报错的问题

原创 tensorflow添加自定义OP（GPU版本）

转载 tensorflow创建动态库文件来自定义op

原创 重新编译tensorflow源代码遇见的问题解决方法

原创 ubuntu16.04下tensorflow-GPU源代码安装教程

空空如也

空空如也

原创腾讯面试总结

原创解决nvprof工具使用报错的问题

原创重新编译tensorflow源代码遇见的问题解决方法