- 博客(171)
- 资源 (8)
- 收藏
- 关注
原创 小波变换第2讲:尺度函数与小波函数
Content1 尺度函数1.1 Harr尺度函数1.2 尺度函数的重要性质1.2.1 VjV_jVj空间的正交基1.2.2 嵌套子空间1.2.3 交空间和并空间1.2.4 尺度函数递归等式2 小波函数2.1 Harr小波函数参考文献前文Why wavelet?介绍了FT以及STFT在时频分析方面的缺陷,本文将介绍小波变换的主体部分。小波变换(WT)方面的不同书籍,涉及到的一些定义不尽相同,对理解小波造成了一些困扰。本文主要参考的是冈萨雷斯 数字图像处理 第3版第7章的有关内容。本文中的尺度函
2021-08-25 16:53:01 12470
原创 pytorch 常用loss函数整理篇(一)
loss函数大全参考文件平均绝对误差(MAE)/L1 Loss当torch.nn.L1Loss的参数reduction选择’sum’时即为L1 loss;当选择 ‘mean’ /'none’时,即为MAE。KaTeX parse error: Can't use function '\]' in math mode at position 74: …_i^p} \right|} \̲]̲............
2020-05-04 13:13:12 7710
原创 cuda加速:memory coalescing,Bank Conflicts
实际的共享内存由32个bank组成,warp由32个线程组成。这里仅用4个bank(A、B、C、D)以及4个thread来进行说明。参考【1】中给出的定义:一个warp中,thread 0到thread 31访问连续的内存空间,则这些线程的访问被合并为一次访问。下图两种情况均能保证一个thread访问不同的bank,不会造成bank conflict。不同的线程访问同一个bank,会导致串行访问,这称之为bank conflict。
2024-02-22 18:20:54 395
原创 混合精度训练
下图是使用FP32训练Multibox SSD detector network时梯度的直方图。当这些数据用FP16进行表示时,很大一部分FP32表示时的非零值,就会变成0。这将会导致一些权重无法实现更新,进而导致模型不收敛。为了防止FP16表示时很多梯度数据为0的问题,就需要使用 loss scaling。下图灰色曲线代表不使用loss scaling,进行混合精度训练时不收敛。中的一张图,来说明 loss scaling的必要性。
2024-02-22 18:19:02 456
原创 c++ class总结
在父类中对某成员函数不进行实现,而放在子类中具体实现,就要用到纯虚函数。静态成员变量不专属于某一个类对象,可以通过类或者类对象进行访问。当基类指针指向派生类对象时,调用时却使用了基类中相应的成员函数。除了将整个类都作为友元类,还可以定义将类的函数作为其他类的友元。const修饰的成员函数中,成员变量通常来说不能进行修改。静态成员函数也是相似的,可以通过类或者类对象进行访问。类进行实例化后,通过其对象不能访问类的私有属性和函数。另外,子类对应的成员函数定义时,也可加上。中public属性的成员及成员函数。
2024-01-24 09:39:30 619
原创 Jetson nano 系列之8—jetson nano的PWM驱动
本博客介绍了使用jetson nano及PCA9685芯片,实现舵机的PWM控制。
2023-12-16 15:43:57 1319
原创 使用tensorrt加速深度学习模型推断
此博客介绍如何将resnet101模型在CIFAR100数据集的分类任务,使用tensorrt部署。完整代码如下。
2023-12-03 18:40:36 529
原创 shell脚本入门
中的内容:循环打印该文档中的内容:2.if语句参考文献[1] Shell循环语句详解–for循环[2] [shell脚本报错:“[: =: unary operator expected“解决办法(https://blog.csdn.net/weixin_42891455/article/details/121339338)
2023-11-02 12:42:05 78
原创 Jetson nano 系列之7—jetson 通过rtp将视频发给远程host
本博客介绍了将jetson nano csi摄像头的视频通过rtp发给其他主机(这里是一台windows笔记本)。
2023-10-15 11:44:39 648
原创 使用opencv及FFmpeg编辑视频
我使用的是第一个压缩包。剪切到自定义位置,并设置好系统路径。在这之前音频文件要准备好。此时保存的视频没有声音。其中一个视频为背景。
2023-10-07 00:23:03 1406
原创 [cuda 技术总结1] 第一次调用 cuda 库函数 耗时很长
在cuda编程中,发现调用cuda文件总耗时一百多ms,而纯kernel计算时间才3ms。时间都去哪了?查资料,trouble shooting,最后才发现这多出来的时间,就是第一次调用cuda api的时间:隐式cuda初始化,加载上下文…2.Linux下将驱动加载的默认模式改成“持久保存”
2023-07-14 14:16:00 927
原创 一种求数组/列表最大值次大值的方法,思路很nice!
它从最大值对应序号的下一个元素出发,通过余数及设置遍历次数,恰好遍历除了最大值之外的整个数组/列表。获取最大值的方法,即我们通常使用的遍历方法。获取次大值的方法,使用遍历,需要点技巧。
2023-05-09 14:08:56 404 1
原创 【分享NVIDIA GTC 23大会干货】加速生成式AI在生物学和医疗领域的应用
在此做个分享。生成式AI可以说是此次GTC大会的关键词之一。正如session中所讲,生成式AI是AI领域的next wave/chapter。以CHATGPT为代表的生成式AI模型可以说近期是万众瞩目。使用CHATGPT可以实现判若真人的对话、帮助人们回答一些问题,协助完成一些工作,如写一段代码;使用DALL-E,输入一段文字,生成一张对应的图片;使用alphafold,从蛋白质氨基酸序列预测蛋白质三维结构…那么在生物学和医疗领域,生成式AI具体有什么应用呢?
2023-03-23 01:09:22 1229 3
原创 Diffusion model之DDPM
DDPM(Denoising Diffusion Probabilistic Models)扩散模型由两个过程组成:forward process(diffusion process)以及reverse process。forward process用于以markov链的形式向原始数据逐渐添加高斯噪声;reverse process接受随机噪声,生成目标数据(如图片)。本文介绍均以图片为例。
2023-03-09 18:22:32 1046
Spectral Representations of Natural Images
2022-10-19
GCN的pytorch实现
2022-10-08
small_object_detection
2021-11-10
YOLO_V4模型可视化.zip
2021-05-08
mnist_kd.ipynb
2021-04-27
faster_rcnn.vsd
2021-04-10
使用resnet FCN训练VOC2007 数据集语义分割
2020-12-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人