现代C++下的闭包与匿名函数机制
2024-07-11 21:43:45
696
优化器的数学原理,以及优化器的发展,从SGD到AdamW。
2024-05-22 20:58:28
1102
可以使用C++11中的chrono库来进行计时,也可以使用cuda事件来计时,这里展示用cuda事件来计时,省略了无关的代码例如内存初始化等步骤。可以看到时间扩大了很多,再算一遍得到有效带宽:248.35268656412760416666666666667GB/s略小于显卡的有限带宽。该工具在11.6以后就被弃用了,现在使用的是Compute Sanitizer。上面那个计时代码没用进行free,会导致内存泄漏,可以使用工具检测一下试试。CUDA提供了名为CUDA-MEMCHECK的工具集’具体包括。
2024-05-22 16:18:02
869
SIMT在GPU中使用,SIMT指单指令多线程,以线程为单位,所有的线程代码相同,但是处理的数据可能不同,例如Nvidia的GPU,动则上千线程。8个线程是逻辑宽度。C++11以后在编译器层提供了内存模型的选项,是对体系结构中的内存模型的进一步封装,如果在C++中选择了强顺序,那么在ARM这种弱顺序的平台上生成的代码会添加很多内存屏障以确保强顺序。一条指令在CPU中的运行需要经过:取指令,译指,发射,执行,存储这几个步骤,除了指令所在的执行环节外,其他环节的电路空着也是空着,所以就提出了流水线技术。
2024-05-20 17:47:51
830
C++11并行编程知识点 & 案例代码
2024-05-19 20:59:00
931
modern C++,从C++98中进化来的现代C++
2024-05-19 17:21:09
493
从transformer到LLM的变化以及当下LLM的一些相关技术
2024-05-15 21:42:50
1234
2
其他博客中较少提及的Transformer的细节内容
2024-05-15 20:19:17
626
C++中该报错的可能情况以及解决办法
2024-05-10 12:09:56
962
Android基础知识
2024-05-07 21:41:31
394
Linux下与并发编程相关的内容
2024-05-07 11:09:05
916
1
安卓开发基本知识 & Android Studio使用方法 & Hello World APP案例
2024-05-06 22:16:52
842
C++中的时间处理库time.h和chrono
2024-04-28 15:21:42
516
OpenGL从零画个三角形
2024-04-24 17:26:59
676
详细解释Linux下的VFS虚拟文件系统,以及一个进程如何进行IO的全过程
2024-04-21 11:41:07
735
X86汇编
2024-04-08 22:19:47
359
操作系统基础知识以及功能以及向上向下接口的有关知识
2024-04-08 17:58:59
909
有其他类C编程语言的基础上,学习C#,借助其他类C语言基础快速入门
2024-04-07 22:27:12
1153
三极管以及MOS管的各自原理以及相应的优缺点
2024-04-07 17:21:42
1290
使用Clang实现一遍从源代码到二进制的全过程,加深对程序编译的理解
2024-04-06 22:26:30
1114
详细梳理shell,Bash/Zsh/fish,POSIX,Linux/Unix之间的关系
2024-04-01 19:03:38
803
区分Rust中的函数返回Option和Result
2024-03-30 23:48:28
656
使用Rust实现一个简单的RISC-V架构的CPU雏形,支持add,sub,addi三个指令。
2024-03-30 22:00:58
1402
Rust闭包,并发编程,智能指针
2024-03-28 23:57:28
1282
详细解释了Rust的项目管理和代码架构管理的方法,以及相应的几个专有名词。
2024-03-28 17:47:00
1703
Rust中的生命周期机制以及异常处理机制
2024-03-27 21:34:09
1086
CUDA编程绪论,讲解what,why,以及how
2024-03-26 23:04:46
1035
Rust基本语法以及特性理解。
2024-03-26 22:34:36
1430
可以确保对于任何技术水平的程序员都能做到内存安全且高性能。cargo不仅会配置项目的依赖信息,还会配置版本控制系统,默认自动进行git init,生成gitignore文件,也可以使用–vcs来切换到其他版本控制系统。这就是为什么要开发rust,为了在不损失高性能的情况下,实现一种机制保证内存安全。C++/C:无GC,无法确保内存安全,学习曲线一般,但是要学的很多,称为高手确保代码内存安全不容易。Python:有GC(垃圾回收机制),内存安全,学习曲线平缓。编译方法:rustc ./main.rs。
2024-03-25 20:07:15
538
计算机体系结构概述
2024-03-25 17:38:39
801
使用python进行简单的网页数据爬取
2024-03-24 23:04:13
3249
3
讲解如何使用TensorRT实现自定义算子,并以plugin的形式插入到模型中
2024-03-24 22:00:01
515
tensorRT提供的模型优化工具和性能分析工具
2024-03-15 22:48:35
504
TensorRT提供的辅助工具
2024-03-15 11:34:18
404
AI编译器,再不学就晚啦!
2024-03-14 23:34:57
1330
yolov1到yolov5的模型以及损失函数和改进之处的讲解。
2024-03-14 14:30:59
1385
TensorRT的完整workflow
2024-03-13 18:23:42
1646
1
从面向对象谈到模板编程,再到函数编程,再到现代C++,一个C++新人对于C++的一点认知。
2024-03-12 22:38:15
827
揭开onnx模型的神秘面纱,讲解了onnx模型的概念以及配套的工具
2024-03-12 19:06:43
1453
探讨了TensorRT的工作流,并给出了一个demo
2024-03-11 23:36:47
416