笔记
文章平均质量分 68
帅的发光发亮
冲冲冲!
展开
-
coco2017数据集COCO格式转YOLO格式
【代码】coco2017数据集COCO格式转YOLO格式。原创 2022-10-27 17:51:12 · 2703 阅读 · 0 评论 -
CUDA程序优化之数据传输
CUDA程序优化设备端和主机端的数据相互拷贝不同的内存分配/传输方式,传输效率有何不同?(1)常规方式传输:cudaMemcpy(2)高维矩阵传输:cudaMemcpy2D/cudaMalloc3D(3)异步传输:cudaMemcpyAsync / cudaMemcpy2DAsync / cudaMemcpy3DAsync(4)锁页内存(Page-locked)(5)零拷贝内存(Zero-Copy)(6)CUDA流的使用多个流的使用1) GPU的工作调度机制2) 高效的运用多个CUDA流CUDA C/C++原创 2021-06-19 16:02:20 · 14638 阅读 · 8 评论 -
卷积层(FCN)替换全连接层(FC)的意义
1.卷积层替换全连接层的可行性:卷积层是局部连接,它的特点是稀疏连接和权值共享;而全连接层使用了图像的全局信息,每个神经元都与上一层的所有神经元相连接。“最大的局部”和“全局”这两个概念其实是等价的,因此卷积层替换全连接层是可行的。2.全连接层到卷积层的转换:下图显示了AlexNet卷积化的过程,假设执行特征提取的卷积层的最后一层输出为256×7×7,得到后面的4096个神经元;那么改为用7×7的卷积核对该256×7×7的输出特征图做卷积,也可以获得4096×1×1的向量。由于卷积核大小和输入的特征原创 2021-05-07 15:32:46 · 23655 阅读 · 0 评论 -
实操案例入手、讲解 CMake 的常见用法。
这里写自定义目录标题什么是 CMake入门案例一:单个源文件1、编写源文件2、编写 CMakeLists.txt3、编译项目入门案例二:多个源文件入门案例三:多个目录,多个源文件入门案例四:自定义编译选项入门案例五:安装和测试什么是 CMake你或许听过好几种 Make 工具,例如 GNU Make ,QT 的 qmake ,微软的 MS nmake,BSD Make(pmake),Makepp,等等。这些 Make 工具遵循着不同的规范和标准,所执行的 Makefile 格式也千差万别。这样就带来了一原创 2021-01-08 00:00:57 · 18221 阅读 · 0 评论 -
Linux将本地项目上传到github
主要有以下几个步骤:登录github,新建一个项目new repository 把当前目录变成git可以管理的仓库确认当前目录是自己的项目工程目录,在终端输入 git init 此时终端会显示“初始化空的Git仓库于/…git”添加所有需要上传的文件和配置到git git add FILE添加确定的文件FILE git add .添加当前目录下所有文件查看当前提交状态 git status 显示当前所有提交的状态“初始提交”即表明初始化了commit命令,等待提交。同样,我们也可以在这个时候选择原创 2021-01-07 23:48:16 · 19330 阅读 · 0 评论 -
CUDA快速入门讲解、硬件结构、软件程序!
CUDA(Compute Unified Device Architecture)的中文全称为计算统一设备架构。做图像视觉领域的同学多多少少都会接触到CUDA,毕竟要做性能速度优化,CUDA是个很重要的工具,CUDA是做视觉的同学难以绕过的一个坑,必须踩一踩才踏实。CUDA编程真的是入门容易精通难,具有计算机体系结构和C语言编程知识储备的同学上手CUDA编程应该难度不会很大。本文章将通过以下五个方面帮助大家比较全面地了解CUDA编程最重要的知识点,做到快速入门:文章目录1. GPU架构特点2. CUDA线原创 2020-10-28 23:57:37 · 18587 阅读 · 0 评论 -
基于pytorch模型剪枝的实现(极大的减少模型计算参数加快模型运行速度)
深度模型剪枝实现以及一些网络优化技巧模型剪枝:Learning Efficient Convolutional Networks Through Network Slimming (ICCV 2017).基于论文的代码复现以及拓展:在网络上中加入其它优化方法最强深度学习优化器Rangerwarm up与consine learning rate为什么使用warmup?label smoothapex混合精度训练梯度累加其他网络部署的方式:模型剪枝:Learning Efficient Convolutio原创 2020-10-03 20:59:49 · 27381 阅读 · 4 评论 -
win10 vs2019编译c++版本的numpy
下载github源码git clone https://github.com/dpilger26/NumCpp.git把文件解压出来,这是我的路径。然后以管理员身份打开命令提示行cd到解压文件的路径;然后进行如下操作mkdir buildcd buildcmake ..最后输入:cmake --build . --target install这就编译完成了,最后在vs里边导入就行了。...原创 2020-09-04 09:14:38 · 18897 阅读 · 0 评论 -
TensorRT python接口搭建常用技巧
PyTorch的Batch NormalizationPyTorch提供的BN层的定义,位于torch.nn.BatchNorm2d,公式已经在注释中说明,或者直接看文档也行: 简单地,是batch的均值,是batch的方差,为了防止除0,对应batch学习得到的权重,就是偏置。在PyTorch中相对应的,对于任意一个in层,它会有如下的结构:w...原创 2020-11-12 11:02:45 · 18501 阅读 · 0 评论 -
jetson nano安装pycuda
JetPack4.4版本使用之前配置cuda的环境$ sudo nano ~/.bashrcexport PATH=/usr/local/cuda-10.2/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATHexport CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.2$ sudo source ~/.bashrc$ nvcc -V 检测一下是否配置成功之后下载[p原创 2020-06-01 14:15:16 · 26904 阅读 · 19 评论 -
在jetson nano上安装bazel
发现居然没有在jetpack 4.4 版本上安装bazel的教程,今天发一个。先安装一些必要的东西,当然你搞深度学习,这些东西基本都是有的。sudo apt-get install pkg-config zip g++ zlib1g-dev unzip python3sudo add-apt-repository ppa:webupd8team/javasudo apt-get updatesudo apt install openjdk-11-jdk然后github下载 ,一定要后缀为-di原创 2020-05-25 17:30:59 · 20167 阅读 · 2 评论 -
Python3使用Socket实现树莓派,jetson与计算机半双工通信,实现聊天功能
项目中需要实现PC与树莓派通信完成控制,寻找一遍后,发现现例子大多比较简单,可以实现一次收发过程,第二次数据发送就会出现问题。观察发现少一个循环,无法保持联通状态,代码修改后可以简单的实现半双工通信,实现简单聊天应答功能。首先在命令行下ipconfig 查出设备ip。client与server端为同一ip,以server端为准。server端代码:import socketHOST = '192.168.0.100' # 连接本地服务器PORT = 8001原创 2020-05-15 21:06:14 · 18042 阅读 · 0 评论 -
Jetson Nano 上安装 tensorflow2.1 和 pytorch1.4
基于目前最新的JetPack 4.3的镜像。开机配置什么的请参考博客:https://blog.csdn.net/iracer/article/details/104453423第一步:安装相关依赖sudo apt-get install libhdf5-serial-dev hdf5-tools libhdf5-dev zlib1g-dev zip libjpeg8-devsudo ap...原创 2020-04-22 12:07:55 · 19040 阅读 · 4 评论 -
从零开始在Windows10的Ubuntu子系统中编译安装YOLOv3
标题 <<从零开始在Windows10的Ubuntu子系统中编译安装YOLOv3>>再win10上安装ubuntu子系统这里不再叙述,不清楚可搜索相应的文章观看。在目标检测(object detection)领域,YOLOv3是一个巅峰般的存在,简单来说,就是又快又准,如下图所示:第一步,安装YOLOv3依赖项。a. 下载安装最新版英伟达显卡驱动:https://...原创 2020-03-04 09:44:52 · 18682 阅读 · 5 评论