- 博客(6)
- 收藏
- 关注
原创 腾讯面试总结
从开始报腾讯的暑期实习开发岗开始算起,第三天晚上就突然收到了面试的电话,那两天正在忙于复习数据结构、和网络的知识,面试的自我介绍都没有准备。没办法接到电话的那一刻只能硬着头皮上了。 果然,一开始就先做个自我介绍,我只能把我目前做过的项目,学校都介绍了一下。然后面试官又详细的问了我的实习项目,感觉他对我做的深度学习的项目很感兴趣,问了我对tensorflow的理解,和用过什么函数之类的知...
2019-03-27 09:48:59 423
原创 解决nvprof工具使用报错的问题
今天编译了个算矩阵相乘的程序,想用nvprof工具来分析kernel的运行状况。 输入nvprof ./matrix.out结果报错======== Error: unified memory profiling failed.改为 nvprof --unified-memory-profiling off ./matrix.out 成功!...
2018-09-09 17:37:44 2390
原创 tensorflow添加自定义OP(GPU版本)
今天试了下注册GPU支持的OP。 GPU内核 GPU内核分两部分实现:OpKernel和CUDA内核及其启动代码。有时OpKernel的实现在CPU和GPU内核之间很常见,比如检查输入和分配输出。在这种情况下,建议的实施是:定义在Device上模板化的OpKernel和张量的基本类型。为了完成输出的实际计算,Compute函数调用模板函子结构。该函数对CPUDevice的专门化定...
2018-09-08 15:53:04 3326 5
转载 tensorflow创建动态库文件来自定义op
目前正在学习tensorflow自定义OP,刚学会如何添加和添加简单的op代码。预备技能 对 C++ 有一定了解. 已经下载 TensorFlow 源代码并有能力编译它.第一步:找一个文件夹存放你要编译的文件my_add.cc并调用 REGISTER_OP 宏来定义 Op 的接口. 该OP接受两个int32 类型tensor 作为 输入,并将这两个tensor进行求和并将第一位置0输...
2018-09-07 10:02:46 1734 2
原创 重新编译tensorflow源代码遇见的问题解决方法
今天试了一下tensorflow自定义op,在tensorflow源代码下创建一个自己的op后需要重新编译tensorflow,但是我这次编译出现了如下所示的错误: ERROR: /home/torstein/.cache/bazel/_bazel_torstein/1f82ba256daa7468e9c0a1514e0b9aa5/external/local_config_python/BUI...
2018-09-05 10:49:52 1892
原创 ubuntu16.04下tensorflow-GPU源代码安装教程
本文主要讲如何使用ubuntu16.04系统源代码编译tensor flow-GPU。 电脑配置; CPU:i5-5700 GPU:GT-730 内存:16G 我参考了网上很多教程,总结出了自己的一套tensorflow源代码编译的方法。废话不多说现在开始。 1. 如果你想要安装tensorflow-GPU版本首先得确定你电脑的显卡是否支持CUDA,一般来说必须是6系含以上级别的显卡...
2018-09-04 16:36:13 843
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人