- 博客(21)
- 资源 (13)
- 问答 (2)
- 收藏
- 关注
原创 cuda的cublas库
cublas库是在NVIDIA CUDA上实现blas(基本线性代数子程序),该库是已经封装好的,可以利用该库进行向量和矩阵的多种操作cuBLAS包含了三部分:cuBLAS API(从cuda6.0开始)CUBLASXT API(从cuda6.0开始)cuBLASLt API(从cuda10.1开始)cuBLASLt API是一个轻量的矩阵-矩阵运算库(GEMM),且句柄可以复用(类似于cuFFT的句柄可以在相同大小和数据类型的数据上复用句柄)。想要使用cuBLAS API,必须按照以下步骤
2020-05-31 11:44:11 2612 1
原创 Darknet的yolov3.weights文件转换成tensorflow的ckpt或者pb文件
https://github.com/mystic123/tensorflow-yolo-v3python convert_weights_pb.py --class_names mydata.names --data_format NHWC --spp --weights_file H:/code/darknet-master/darknet-master/build/darknet/x64/backup/yolov3-spp_2000.weights生成frozen_darknet_yolov3_m
2020-05-30 23:27:26 1825
原创 CUDA编程.cu文件
一个.cu文件内既包含CPU程序(称为主机程序),也包含GPU程序(称为设备程序)。如何区分主机程序和设备程序?根据声明,凡是挂有“global”或者“device”前缀的函数,都是在GPU上运行的设备程序,不同的是__global__设备程序可被主机程序调用,而__device__设备程序则只能被设备程序调用。CUDA程序文件后缀为.cu,有些编译器可能不认识这个后缀的文件,我们可以在VS的Tools->Options->Text Editor->File Extension里添加cu
2020-05-30 15:24:26 16646
原创 python 生成定长度的序号序列数字
for i in range(0,10): # num_str=str(i+1).zfill(6)000001000002…000010
2020-05-18 18:34:18 2741 1
原创 pytorch各个版本下载
https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/
2020-05-16 11:58:21 562 1
原创 UBUNTU挂载新硬盘导致无法开机
https://blog.csdn.net/ahuabupt/article/details/23464507?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-22.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-22.nonecasehttps://blog.csdn.net/qq
2020-05-16 11:57:24 5199
原创 线程与进程
引言CPU,它承担了所有的计算任务操作系统是计算机的管理者,它负责任务的调度、资源的分配和管理,统领整个计算机硬件;应用程序侧是具有某种功能的程序,程序是运行于操作系统之上的。任务(task)是最抽象的,是一个一般性的术语,指由软件完成的一个活动。一个任务既可以是一个进程,也可以是一个线程。简而言之,它指的是一系列共同达到某一目的的操作。例如,读取数据并将数据放入内存中。这个任务可以作为一个进程来实现,也可以作为一个线程(或作为一个中断任务)来实现。进程进程是一个具有一定独立功能的程序在一个数据
2020-05-16 11:52:18 199
原创 舰船数据集汇总
HRSC2016kaggle Airbus Ship Detection Challenge链接: https://pan.baidu.com/s/1RbGPNr05orfEbUA0u9CmJg 密码: p9b8SeaShips
2020-05-14 20:11:40 20715 6
原创 tensorflow-gpu镜像
https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/tensorflow-gpu/
2020-05-12 21:43:58 1480
原创 内存分页
操作系统的每个进程都拥有自己的虚拟地址空间,对于这个32位操作系统,虚拟内存空间大小为4G。现代操作系统都使用分页来管理内存,把4G分成每一页为2^12 = 4K大小的页,一共有1M个的页(虚拟页VP,VirtualPage)。每一个虚拟页映射到物理内存空间的一个页——物理内存地址空间也划分4K大小的页(物理页PP,PhysicalPage)。这个映射关系的数据结构称为页表。当进程的虚拟页找不到可用的物理页的时候操作系统会执行一个页错误机制,进行物理页和磁盘页的置换。下面进行详细介绍。1.页表页表是将虚
2020-05-12 20:59:52 503
转载 char * ,char ** ,char a[ ] ,char *a[] 的区别
在C语言中字符串常量的本质表示其实是一个地址,这是许多初学者比较难理解的问题。。。 举例: char *s ; s = "China"; 为什么可以把一个字符串赋给一个指针变量。。 这不是类型不一致吗??? 这就是上面提到的关键 。。 C语言中编译器会给字符串常量分配地址,如果 "China", 存储在内存中的 0x3000 0x3001 0x3002 0x3003 0x3004 0x3005 .
2020-05-10 08:43:06 443
原创 extern “C”的作用
extern "C"的主要作用就是为了能够正确实现C++代码调用其他C语言代码。加上extern "C"后,会指示编译器这部分代码按C语言(而不是C++)的方式进行编译。由于C++支持函数重载,因此编译器编译函数的过程中会将函数的参数类型也加到编译后的代码中,而不仅仅是函数名;而C语言并不支持函数重载,因此编译C语言代码的函数时不会带上函数的参数类型,一般只包括函数名。这个功能十分有用处,因为在C++出现以前,很多代码都是C语言写的,而且很底层的库也是C语言写的,为了更好的支持原来的C代码和已经写好的C
2020-05-08 20:47:00 151
原创 FPGA图像处理-线性滤波(均值,高斯,sobel算子)的实现
原理都是线性滤波器。均值滤波该点处的像素值=滤波核范围的像素值取平均降噪高斯滤波平滑该点处的像素值=滤波核范围的像素值乘上高斯系数的和egsobel算子边缘检测,计算方式跟高斯滤波同fpga实现均值滤波步骤一维求和二维求和除法转换行缓存并实现行列像素对齐一维求和连续打四拍,两两并行相加,注意时序增量更新法增量更新是指在进行更新操作时,只更新需...
2020-05-04 21:31:58 1279 1
原创 直方图均衡化
每个点像素计算原理https://blog.csdn.net/superjunenaruto/article/details/52431941?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158850113419724845042409%2522%252C%2522scm%2522%253A%252220140713.130...
2020-05-04 15:03:31 277
原创 CORDIC算法——Verilog
CORIDC 技术并不是什么新鲜的东西。 事实上它可以追溯到 1957 年由 J. Volder 发表的一篇文章。 在上个世纪五十年代, 在大型实际的计算机中的实行移位相加受到了当时技术上的限制, 所以使用 CORDIC 变得非常必要。 到了七十年代, Hewlett Packard 和其他公司出产了手持计算器 , 许多计算器使用一个内部 CORDIC 单元来计算所有的三角函数 ( 了解这件事...
2020-05-04 08:45:26 2237
原创 插值查找
在二分查找中,查找点的计算为:,经过变换后,有:而插值查找,将 1/2改进为插值查找就是根据要查找的关键字 key 与查找表中最大最小记录的关键字比较后的查找方法,其核心在于插值的计算公式从时间复杂度来说,其最坏时间复杂度也是 O(longn),但对于表长较大,而关键字分布又比较均匀的查找表来说,其平均性能要比二分查找好的多。反之,若查找表中关键字分布非常不均匀,那么插值查找未必是很合...
2020-05-04 08:15:23 257
原创 fpga 查表法
查表法查表法的应用范围非常之广,利用查表法,我们可以实现任意的组合逻辑功能,甚至可以实现任意的时序逻辑功能只要系统提供的存储空间(可以是FPGA内部的或外部的)足够大,查表法可以帮助我们实现任何想实现的逻辑功能,这也是为什么我们说查表法是“万能的”了。当然了,对于FPGA设计者来说,通常我们使用查表法,都是为了解决组合逻辑方面的问题,例如,实现任意波形发生器,或者实现任意函数求解器,等等。采...
2020-05-04 08:02:43 2682
转载 FPGA 对数计算
FPGA中实现对数运算主要有三种方法:(1)查表在外部直接算好对数值,按照数值范围做个表,存在ram里,到时候查表。为了减少表深度,提高资源利用率,可以考虑去掉部分低位数值,损失一定的精度。(2)使用cordic算法求解对数。(3)log10(x)=ln(x) * log10(e) , log10(e)是常数可以手动先计算好,用IP Core的话多个乘法器。我们要计算以任意数为底的对数...
2020-05-03 18:02:30 2920 1
原创 除法器 FPGA verilog
计算时先将计算的被除数向前扩展7位,随后由高位向低位逐8位递减,滚动记录差值。首先被减数16位在前边拼接7位0,拼接后不会改变被除数的大小,而且方便向下操作。拼接后将此23位数称为mid。之后取mid的高8位与除数作比较,若大于除数,则减去除数,结果低位拼接一。若小于除数,则验证最高位是不是0,若是则左移一位,结果拼接0.若不是则用高九位减去除数,结果拼接两个0.然后将差和后15位以及末尾一个0...
2020-05-03 17:37:15 2521
原创 重装vs后,cuda重新配置
无cuda项目 解决办法https://blog.csdn.net/u010724874/article/details/89578558卸载cudahttps://blog.csdn.net/weixin_42631693/article/details/103795371下载cuda9 cudnn7.6https://developer.nvidia.com/cuda-90-down...
2020-05-02 18:16:46 1771
原创 OpenCV3.3+VS2015配置 x64 debug release
重装vs后,配置新建空项目opencv_world330d.libopencv_world330.lib在windows文件夹下加入OpenCV动态链接库把E:\OpenCV\opencv\build\x64\vc14\bin目录下的dll文件导入C:\Windows\SysWOW64#include <opencv2/opencv.hpp>#include &l...
2020-05-02 18:07:01 296
win和linux操作系统文件互传 WinSCP-5.17.6-Setup
2020-10-09
Qt安装遇到的问题修复解决方案
2020-08-22
labelme2COCO格式转换,包含了面积计算
2019-04-09
《数学建模算法与应用习题答案》课后习题源码pdf
2018-11-10
C++/OpenCV2.4.xx印刷数字精确识别源码
2018-11-06
ubuntu磁盘空间再分配 不重装系统情况下如何把/usr多余空间给/home
2019-05-12
Opencv image watch auto maximize contrast
2018-06-09
TA创建的收藏夹 TA关注的收藏夹
TA关注的人