- 博客(17)
- 收藏
- 关注
原创 【Transformer实践】代码分析和实现Transformer的每一个组件
基于你了解Transformer理论的基础上,以代码实践为主,手撸Transformer的每个模块的实现
2024-11-27 20:05:58
2000
原创 LLM大模型训练之Trainer类和TrainerArguments类的参数
本文主要介绍Huggingfaca的Transformer库中的Trainer类和TrainerArguments类的参数,主要参考官网的文档,TrainerArguments类是为Trainer提供训练参数的类,所以参数量会更大,有99个。
2024-11-18 12:32:05
1479
原创 LLM的不同精度详解和显存占用,FP16,FP32,BF16
本文从三种精度的详解概念和计算,到每种精度占用显存的计算方式,最后介绍精度之间的相互转换,更深刻理解LLM在训练/推理时的参数类型的使用。
2024-11-18 10:24:21
6504
原创 【tokenization分词】WordPiece, Byte-Pair Encoding(BPE), Byte-level BPE(BBPE)的原理和代码
介绍三种主流的tokenization方法,从分词原理、步骤到代码,深刻理解每种分词方法的特点,和适用的模型和任务场景
2024-11-14 23:31:17
1489
原创 【PDF提取神器】针对LLM推出的PymuPDF4llm库 可提取pdf中的Markdown格式文字/表格/图像/单词
pdf提取的全新库PymuPDF4llm,以markdown格式提取文字,且能提取图像、表格、文字,辅助LLM构建更强大的多模态应用
2024-11-07 15:59:00
2317
原创 【RAG系列】KG-RAG 用最简单的方式将知识图谱引入RAG
介绍如何用最简单的方法将知识图谱加入到RAG的原因、挑战和具体方法,详细实现可见源码。
2024-11-06 17:34:05
1342
原创 【Agent系列】从论文到源码解析Self-Ask 以及数据构建带来的启发
Self-Ask的实现、数据集构建和实验背后的LLM机制,很有探索性的一篇工作。
2024-10-17 22:22:26
1508
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人