- 博客(145)
- 资源 (47)
- 收藏
- 关注
原创 TensorRT Serialization assertion stdVersionRead == kSERIALIZATION_VERSION failed
[TRT] [E] IRuntime::deserializeCudaEngine: Error Code 1: Serialization (Serialization assertion stdVersionRead == kSERIALIZATION_VERSION failed.Version tag does not match. Note: Current Version: 237, Serialized Engine Version: 239
2024-10-18 12:56:18 173
原创 RuntimeError: Cannot insert a Tensor that requires grad as a constant. Consider making it a paramete
RuntimeError: Cannot insert a Tensor that requires grad as a constant. Consider making it a paramete
2024-10-15 16:19:07 227
原创 大语言模型LLM权重4bit向量量化(Vector Quantization)/查找表量化基本原理
针对大语言模型权重的4bit量化,除了常规的广泛使用的group-wise均匀量化,如GPTQ, AWQ等等,苹果提出了一种称为Palettization的lookup table (LUT)查找表量化技术,高通也提出了新的一种向量量化技术,其实这两种技术原理基本上是相同的
2024-09-06 10:12:49 1350
原创 Unsupported: ONNX export of convolution for kernel of unknown shape
错误提示为Caused by the value '28 defined in (%28 : Float(*, *, *, *, strides=[199692, 66564, 258, 1], requires_grad=0, device=cpu)这种问题一般出现在卷积的权重不是常规的直接的训练参数,而是从其他计算分支计算得到。这里指示了是test.py第10行引起的,也就是pad那一句导致的。这其实是底层infer shape的bug。这使得x的shape重新被完全静态确定。
2024-07-19 17:02:16 961
原创 TP TN FP FN(true positive, false negative等)的理解
比如,你判断一件事情是阳性,但是你的判断是错的,就是false positive。第二个词positive或者negative,表明判断的内容是阳性还是阴性。第一个形容词为true, false表名这个判断是正确还是错误的。
2024-07-13 23:52:46 122
原创 Transformer 从attention到grouped query attention (GQA)
Transformer 从Attention到grouped query attention (GQA)
2024-05-28 16:38:54 1270
原创 导出LLaMA ChatGlm2等LLM模型为onnx
通过onnx模型可以在支持onnx推理的推理引擎上进行推理,从而可以将LLM部署在更加广泛的平台上面。此外还可以具有避免pytorch依赖,获得更好的性能等优势。
2023-08-05 19:15:07 5613
原创 SentencePiece android ndk编译
LLaMa等LLM语言模型一般使用SentencePiece tokenizer,在端侧部署需要编译和使用其c++版本。在安卓平台使用NDK编译CMakeLists.txt需要进行一些修改:
2023-07-27 09:37:17 1111 1
原创 基于onnx模型和onnx runtime推理stable diffusion
基于onnx模型和onnx runtime推理stable diffusion
2023-03-25 21:51:18 3807
原创 android NDK编译openblas和向量检索库faiss
android编译openblas和faiss库,android NDK build openblas and faiss
2022-10-26 19:32:11 1819 5
原创 深度学习性能优化之图优化
这里总结了深度学习模型常见的部分图优化,有一些现有的深度学习框架已经有了,有些是作者的独特发现,现有深度学习框架还没有。
2022-09-11 18:56:35 4739
原创 sublime text自定义clang format插件格式化C++代码
sublime text自定义clang format插件格式化C++代码。本文内容为在windows平台上通过sublime text开发自定义插件实现调用clang format对C/C++代码进行格式化。
2022-06-17 16:14:57 1501
原创 Android基于ndk和cmake开发C++命令行程序
Creating a simple Hello World application Using Android NDK with C++ · GitHubandroid Ndk学习笔记01之Hello World! - 简书https://developer.android.com/ndk/samples/sample_hellojni
2022-05-30 10:59:45 2295
DeepSpeed System Optimizations Enable Training Deep Learning
2021-10-23
Netron-Setup-4.5.0.zip
2020-09-12
cmake-3.17.2-win64-x64.zip
2020-05-23
伯克利 常用经典算法.pdf
2019-09-04
伯克利 常用经典算法.zip
2019-09-04
Practical data acquisition for instrumentation and control systems
2018-12-10
Protocol Buffer sublime text 3插件
2018-08-06
概率分布手册Hand-book on statistical distributions for experimentalists
2018-03-01
BFGS Optimization curve fitting 优化曲线拟合
2017-12-07
Handbook of Fluorescence Spectroscopy and Imaging
2017-11-23
CRLB 讲解PPT
2017-10-03
Principles of Optics 7th ed M.Born,E.Wolf.pdf 光学原理
2017-09-01
Principles of Fluorescence Spectroscopy Third Edition Joseph R Lakowicz.pdf
2017-08-13
免费高清屏幕录制软件FreeScreenVideoRecorder_3.0.45.1027
2016-11-10
深度学习 Deep Learning book, MIT, Ian Goodfellow, Aaron Courville, and Yoshua Bengio
2016-04-22
nnImplementationV2 神经网络C++实现
2016-04-21
sublime text 2 3 system verilog自动补充插件
2015-02-01
altera官方上海Quartus II时序分析相关三天培训教材练习实例_day3
2015-01-30
altera官方上海Quartus II时序分析相关三天培训教材练习实例_day2
2015-01-30
altera官方上海Quartus II时序分析相关三天培训教材练习实例_day1
2015-01-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人