自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 RAII与智能指针

本文主要介绍C++中的RAII理念以及智能指针的使用,并举出了相应的例子进行举例说明。

2024-01-17 19:28:07 949

原创 CUDA:矩阵乘法的实现

说在前面:本篇文章给出矩阵乘法在cpu和gpu上的实现,对代码做出详细的解释,并给出完整的可运行的代码。

2024-01-10 15:50:05 537 1

原创 CUDA:目标检测后处理的GPU实现

我们在这篇博客中通过两个核函数decode_gpu和nms_gpu对目标检测算法的输出进行处理,decode_gpu初略的删除了置信度低的框,并将每个框的信息进行整理输出。nms_gpu对decode_nms的输出进行进一步的处理,删除了预测框中重叠度高的框。

2024-01-10 11:52:40 921 1

原创 CUDA:矩阵转置算子实现

说在前面:本篇文章实现了矩阵乘法在gpu上的两种实现,一个比较粗糙的版本和一个优化后的版本。

2024-01-09 22:52:17 504

原创 CUDA: reduce算子的实现

说在前面:本篇博客主要介绍reduce算子在cpu和gpu上的多种代码实现。

2024-01-09 21:47:18 523

原创 CUDA:GELU算子的实现(FP16)

本文是通过CUDA实现GELU算子,输入和输出的数据是FP16类型的,通过自定义向量结构体进行向量化访存的方式来提高算子工作效率,并会详细解释相关代码。

2023-12-28 13:12:15 1759 1

原创 C++面经

答:面向对象的特征包括封装,继承和多态。封装是将数据和操作数据的方法隐藏起来,具体形式比如类,结构体。封装的好处就是隐藏的数据的内部实现,提高了代码的可维护性和安全性。继承就是指一个类继承另一个类的特性和行为,被继承的类称为父类,继承的类称为子类。继承的好处在提高代码的复用性。多态就是说对象在运行时会表现出不同的行为状态,多态包括编译时多态和运行时多态,编译时多态是说这个对象的行为是在编译时确定的,比如函数重载,函数模板和类模板。运行时多态是指对象的行为是在运行时确定的,比如常说的父类的指针指向子类的对象。

2023-12-25 15:14:12 888

原创 CUDA:在GPU上实现向量加法的两种方法

本文主要向量加法的多种实现,包括在CPU上的一种实现和在GPU上的两种实现。

2023-12-25 12:05:17 642

原创 CUDA:一个完整的CPU>>GPU程序

说在前面:本文主要给出一个简单的CUDA程序,用来说明一个完整的核函数是如何在CPU端进行调用的,并且会对相关代码做出详细解释。

2023-12-22 11:41:24 1144

原创 CUDA简介

本文主要介绍通过CUDA进行gpu编程的一些前置知识,包括GPU硬件结构和软件层面的一些内容。

2023-12-21 13:55:42 1532

原创 c/c++内存泄漏解决方案:hook函数

本文主要介绍关于内存泄漏的相关知识,包括什么是内存泄漏,以及如何使用hook函数去判断是否存在内存泄漏以及发现内存泄漏具体位置。

2023-12-21 11:42:28 1815

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除