自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(75)
  • 收藏
  • 关注

原创 modern C++:闭包与匿名函数

现代C++下的闭包与匿名函数机制

2024-07-11 21:43:45 696

原创 神经网络优化器-从SGD到AdamW

优化器的数学原理,以及优化器的发展,从SGD到AdamW。

2024-05-22 20:58:28 1102

原创 深度学习模型部署(十三)CUDA编程-基本流程&相关工具

可以使用C++11中的chrono库来进行计时,也可以使用cuda事件来计时,这里展示用cuda事件来计时,省略了无关的代码例如内存初始化等步骤。可以看到时间扩大了很多,再算一遍得到有效带宽:248.35268656412760416666666666667GB/s略小于显卡的有限带宽。该工具在11.6以后就被弃用了,现在使用的是Compute Sanitizer。上面那个计时代码没用进行free,会导致内存泄漏,可以使用工具检测一下试试。CUDA提供了名为CUDA-MEMCHECK的工具集’具体包括。

2024-05-22 16:18:02 869

原创 并行编程(一)相关技术&工具&理论基础

SIMT在GPU中使用,SIMT指单指令多线程,以线程为单位,所有的线程代码相同,但是处理的数据可能不同,例如Nvidia的GPU,动则上千线程。8个线程是逻辑宽度。C++11以后在编译器层提供了内存模型的选项,是对体系结构中的内存模型的进一步封装,如果在C++中选择了强顺序,那么在ARM这种弱顺序的平台上生成的代码会添加很多内存屏障以确保强顺序。一条指令在CPU中的运行需要经过:取指令,译指,发射,执行,存储这几个步骤,除了指令所在的执行环节外,其他环节的电路空着也是空着,所以就提出了流水线技术。

2024-05-20 17:47:51 830

原创 Modern C++(二)C++并行编程

C++11并行编程知识点 & 案例代码

2024-05-19 20:59:00 931

原创 ModernC++(一)C++11

modern C++,从C++98中进化来的现代C++

2024-05-19 17:21:09 493

原创 大模型算法(一):从Transformer到ViT再到LLaMA

从transformer到LLM的变化以及当下LLM的一些相关技术

2024-05-15 21:42:50 1234 2

原创 大模型算法(零) - Transformer中的细节与实现

其他博客中较少提及的Transformer的细节内容

2024-05-15 20:19:17 626

原创 undefined reference to问题的一种可能情况以及问题发生的原因

C++中该报错的可能情况以及解决办法

2024-05-10 12:09:56 962

原创 安卓开发(二)Android开发基础知识

Android基础知识

2024-05-07 21:41:31 394

原创 并发编程-Linux环境

Linux下与并发编程相关的内容

2024-05-07 11:09:05 916 1

原创 安卓应用开发(一):工具与环境

安卓开发基本知识 & Android Studio使用方法 & Hello World APP案例

2024-05-06 22:16:52 842

原创 C++中的时间相关处理

C++中的时间处理库time.h和chrono

2024-04-28 15:21:42 516

原创 OpenGL编程(一):三角形大作

OpenGL从零画个三角形

2024-04-24 17:26:59 676

原创 Linux文件系统详解

详细解释Linux下的VFS虚拟文件系统,以及一个进程如何进行IO的全过程

2024-04-21 11:41:07 735

原创 X86汇编速成

X86汇编

2024-04-08 22:19:47 359

原创 操作系统理论知识快速总览

操作系统基础知识以及功能以及向上向下接口的有关知识

2024-04-08 17:58:59 909

原创 C#速览入门

有其他类C编程语言的基础上,学习C#,借助其他类C语言基础快速入门

2024-04-07 22:27:12 1153

原创 数电模电-MOS管和三极管

三极管以及MOS管的各自原理以及相应的优缺点

2024-04-07 17:21:42 1290

原创 C语言程序编译全流程,从源代码到二进制

使用Clang实现一遍从源代码到二进制的全过程,加深对程序编译的理解

2024-04-06 22:26:30 1114

原创 Shell与Bash与POSIX与Linux间的关系

详细梳理shell,Bash/Zsh/fish,POSIX,Linux/Unix之间的关系

2024-04-01 19:03:38 803

原创 Rust语言中Option和Result两种类型的使用

区分Rust中的函数返回Option和Result

2024-03-30 23:48:28 656

原创 Rust练手:从零手撸RISC-V架构虚拟机(一)(附完整代码)

使用Rust实现一个简单的RISC-V架构的CPU雏形,支持add,sub,addi三个指令。

2024-03-30 22:00:58 1402

原创 Rust编程(五)终章:查漏补缺

Rust闭包,并发编程,智能指针

2024-03-28 23:57:28 1282

原创 Rust编程(四)Package&Crate&Module

详细解释了Rust的项目管理和代码架构管理的方法,以及相应的几个专有名词。

2024-03-28 17:47:00 1703

原创 Rust编程(三)生命周期与异常处理

Rust中的生命周期机制以及异常处理机制

2024-03-27 21:34:09 1086

原创 深度学习模型部署(十二)CUDA编程-绪

CUDA编程绪论,讲解what,why,以及how

2024-03-26 23:04:46 1035

原创 Rust编程(二)语法和数据类型

Rust基本语法以及特性理解。

2024-03-26 22:34:36 1430

原创 Rust编程(一)

可以确保对于任何技术水平的程序员都能做到内存安全且高性能。cargo不仅会配置项目的依赖信息,还会配置版本控制系统,默认自动进行git init,生成gitignore文件,也可以使用–vcs来切换到其他版本控制系统。这就是为什么要开发rust,为了在不损失高性能的情况下,实现一种机制保证内存安全。C++/C:无GC,无法确保内存安全,学习曲线一般,但是要学的很多,称为高手确保代码内存安全不容易。Python:有GC(垃圾回收机制),内存安全,学习曲线平缓。编译方法:rustc ./main.rs。

2024-03-25 20:07:15 538

原创 计算机体系结构-概述

计算机体系结构概述

2024-03-25 17:38:39 801

原创 python写爬虫爬取京东商品信息

使用python进行简单的网页数据爬取

2024-03-24 23:04:13 3249 3

原创 深度学习模型部署(十一)TensorRT写Plugin

讲解如何使用TensorRT实现自定义算子,并以plugin的形式插入到模型中

2024-03-24 22:00:01 515

原创 深度学习模型部署(十)模型部署配套工具二

tensorRT提供的模型优化工具和性能分析工具

2024-03-15 22:48:35 504

原创 深度学习模型部署(九)TensorRT辅助工具一

TensorRT提供的辅助工具

2024-03-15 11:34:18 404

原创 深度学习模型部署-番外-TVM机器学习编译

AI编译器,再不学就晚啦!

2024-03-14 23:34:57 1330

原创 Yolo系列各代网络结构分析(一)

yolov1到yolov5的模型以及损失函数和改进之处的讲解。

2024-03-14 14:30:59 1385

原创 深度学习模型部署(八)TensorRT完整推理流程

TensorRT的完整workflow

2024-03-13 18:23:42 1646 1

原创 C++鸟瞰(个人心得)

从面向对象谈到模板编程,再到函数编程,再到现代C++,一个C++新人对于C++的一点认知。

2024-03-12 22:38:15 827

原创 深度学习模型部署(五)onnx模型以及相应工具

揭开onnx模型的神秘面纱,讲解了onnx模型的概念以及配套的工具

2024-03-12 19:06:43 1453

原创 深度学习模型部署(七)TensorRT工作流and入门demo

探讨了TensorRT的工作流,并给出了一个demo

2024-03-11 23:36:47 416

手写数字识别onnx模型

一个简单的CNN模型,用于识别mnist数据集中的手写数字

2024-03-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除