自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (1)
  • 收藏
  • 关注

原创 IPU Saved Model Tool 异常处理

IPU未初始化 No device target has been configured. Did you configure the IPU devices by running `tensorflow.python.ipu.utils.configure_ipu_system(ipu_options) 原因:代码中未调用IPU初始化的api。 方法:检查pb模型所在目录中是否包含:ipu_cfg.bin文件。若不存在则使用ipu_saved_model_tool的脚本...

2021-11-12 00:10:26 153

原创 IPU Saved Model Tool -- User Guide

【前言】IPU Saved Model Tool是一款用于处理saved_model.pb模型的工具,基于此工具用户可以预览模型信息,转换模型,推理模型,以及对比CPU与IPU模型结果。本手册具体介绍工具的运行环境,具体操作,以及常见问题【环境要求】运行本工具环境应具备IPU加速卡,如在没有IPU加速卡环境运行,应添加CPU仿真环境变量--use_ipu_model到TF_POPLAR_FLAGSexport TF_POPLAR_FLAGS=--max_compilation_thread

2021-11-11 18:25:33 51

原创 cuda对global memery的双调排序

__device__ void swap(int& a, int& b) { int t = a; a = b; b = t;}__global__ void sort(int* a, int flag_j, int flag_i, int count){ unsigned int tid = blockIdx.x * blockDim.x + threadIdx.x; unsigned int tid_comp = tid ^ flag_j.

2020-10-09 11:24:32 118

原创 bashrc

alias l='ls -l' ...

2020-06-22 09:18:44 108

原创 WSL上的ubuntu, wget的时候出现错误

yuki12:~$ wget https://google.co.jp/Will not apply HSTS. The HSTS database must be a regular and non-world-writable file.ERROR: could not open HSTS store at '/home/yuki12/.wget-hsts'. HSTS will be ...

2020-04-27 11:11:01 3932

原创 【贤者之路】Python/c Api 扩展解析

【前言】:最近在做的工程因为函数是用c写的,但是需要对外提供pyhton接口,研究了一下方法,发现几种方法调用,本文主要是介绍python/c api方法的实现代码参照:https://github.com/chanzhennan/Extend_Python【python / c】python/c调用有三种方法,网上有大量的资料【python/c api extension】...

2019-08-01 12:55:36 374

原创 贤者之路,linux编译 llvm 7.1.0 + clang

【前言】因为工作需要编译apach-arrow,里面依赖到llvm7.0以上。但是开发环境是一个互联网的孤岛,需要手动编译llvm,具体操作如下【下载相关源码和模块】可以在http://releases.llvm.org/download.html#7.0.1找到需要的版本,我编译的是7.1.0解压LLVM/Clang等全部源代码(不包括test-suite)。首先解压llv...

2019-07-15 10:23:56 1002

原创 OpenCV 4.1 CUDA 10.1 linux下编译问题【fatal error: nvcuvid.h: No such file or directory】

在linux上面编译Opencv4.1-cuda10,因为要编译opencv cuda库,先要把opencv_contribute并且在编译选项里面指定路径一切就绪开始编译,但是进行到[15%]的时候报了下面的错误fatal error: nvcuvid.h: No such file or directory#include <nvcuvid.h>才发...

2019-05-22 21:23:02 5070 6

原创 贤者之路,cuda版本convertto实现(与OPENCV 3.4 CPU版本数值一致)

【引言】:将一个float32精度的矩阵砍到uchar精度,每个库都会根据自己算法目标类型做一些加速的优化从而导致结果不一样,比如在OpenCV3.4 cpu版本的convertto中, 1.5f的浮点数会变成2, 2.5f也会变成2。 跟传统的四舍五入计算不一样uchar val_char = (uchar)(val_float + 0.5);//传统的四舍五入 输入值为正数【问题测...

2019-03-25 01:07:47 805 2

原创 贤者之路, Caffe转TensorRT

【引】将Caffe转TensorRT的时候,有很多自己设计的接口TensorRT库本身不支持。我们需要自己创建Plugin,本文介绍TensorRT的创建,如何自定义Plugin,和快速书写cuda函数。【结构】将Caffe转TensorRT的时候,有很多自己设计的接口TensorRT库本身不支持。我们需要继承TensorRT里面的IPlugin类来创建自己的Plugin。...

2019-03-18 16:54:05 3209 1

原创 贤者之路,Tensorrt的int8 calibration创建

【INT8 Calibration】无论哪块GPU计算板卡都能够支持Int8的加速,但需要事先生成 calibration文件,下面是.h .cpp分别继承IInt8EntropyCalibrator类,用于创建Int8 table文件#pragma once#include "NvInfer.h"#include "NvCaffeParser.h"#include <ope...

2019-03-18 16:53:44 3833 3

原创 C++之路, 控制测试打印PRINTF

#include &lt;stdarg.h&gt;#ifdef SHOWTIMEstatic void PRINTF(const char *format, ...){ va_list argPtr; int count; va_start(argPtr, format); /* 获取可变参数列表 */ ff...

2019-03-13 14:01:21 188

原创 查找内存泄漏的手法总结

1,全局搜索malloc cudaMalloc calloc, 看变量是否都有对应的free cudaFree2,全局搜索New,看是否有delete对应【引申】 new 和 malloc 的区别, malloc只是开辟一段内存, new是一个操作符,所以会做很多工作,比如调用构造函数(申请内存并且赋值)。如果构造出错还会报错,这些malloc都没有的功能。3, 内存泄漏一般都是...

2019-03-13 13:40:08 160

原创 linux PATH搜索的先后顺序

在linux,一般是用环境变量PATH,C_INCLUDE_PATH,LD_LIBRARY_PATH来控制依赖库的位置和版本,但是应该是PATH=MY_DIR:$PATH还是PATH=$PATH:MY_DIR答案是前者下面是实验所以系统是从前往后查找...

2018-11-16 15:43:24 6529

原创 Ubuntu安装ATLAS

KEYWORD:"Could NOT find Atlas (missing: Atlas_CBLAS_LIBRARY Atlas_BLAS_LIBRARY Atlas_LAPACK_LIBRARY)""CPU Throttling apparently enabled”安装ECO的时候发现找不到Atlas等一系列参数,然后决定去安装altas。但是,apt-get的方法还是找不到...

2018-11-12 23:09:23 4259 1

转载 linux下制作U盘启动

首先在 Linux 系统中打开终端,确认 U 盘路径:sudo fdisk -l(一般是在sdb上面)格式化 U 盘,为了格式化首先需要 umount U 盘: /dev/sdb 是我的 U 盘设备。sudo umount /dev/sdb*(把U盘sdb下的所有分区全部卸下)格式化 U 盘:sudo mkfs.vfat /dev/sdb -I(格式化sdb下所有分区...

2018-10-24 17:02:26 1009

原创 贤者之路,Cuda block内部矩阵求逆,mxm矩阵 复杂度为O(m)

在做线性变换上经常要用到NXN的矩阵求逆。在CUDA用的是高斯消元比较适合并行计算。下面是3X3Cuda实现矩阵求逆的Device函数,也就是说可以直接写到你的kernel函数上去。当然也可以是任何NXN矩阵另外时间上,测试过6X6的矩阵用时在0.016ms,所以可以说基本不耗时。以后会把速度的梯度测试和精度测试结果都放上去。*   1   2   1   |  1  0   0         ...

2018-01-30 11:37:11 2667 4

cuviddec.zip

文件同封了,cuviddec.h 和 nvcuvid.h

2019-09-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除