熬夜造bug-CSDN博客

原创大模型学习路线（11）——模型评测指标

第一章节介绍了机器学习（Machine Learning, ML）和深度学习（Deep Learning，DL）领域评估指标，包含分类任务、预测任务、回归任务、常用损失值；第二章节介绍了大语言模型（LLMs）领域评测指标；第三章节介绍了多模态（MLLMs）领域评估指标；第四章节介绍了知识召回业务领域的评估指标。

2024-05-17 16:21:28 758

原创大模型学习路线（2）——数据工程（数据预处理）

该思维导图参考自ZOMI酱的B站视频整理而来，数据预处理/数据工程全栈式的思维导图如下：视频链接1：ZOMI酱的个人空间-ZOMI酱个人主页-哔哩哔哩视频 (bilibili.com)视频链接2：向量数据库介绍，Vector和Embedding关系 #大模型 #向量数据库_哔哩哔哩_bilibili。

2024-05-16 18:56:17 463 1

原创大模型学习路线（5）—— 大模型压缩（量化、剪枝、蒸馏、低秩分解），推理（vllm）

一、模型压缩目标：（1）减少模型显存占用；（2）加快推理速度；（3）减少精度损失。二、模型压缩算法分类（如何降低权重和激活成本）：（1）模型量化（quantization（2）参数剪枝（pruning）（3）知识蒸馏（knowledge distillation）

2024-05-05 20:31:54 1144 3

原创表征学习/迁移学习/预训练模型

多模态/表征学习/迁移学习/模型预训练

2024-04-18 14:44:56 495 1

原创大模型学习路线（10）——入门项目推荐

章节一呈现了一个入门级demo（小白友好），以VisualGLM（多模型大模型）为例实现了图生文；章节二呈现了一个进阶版demo（适合有一定LLM基础的人群食用），以文心大模型（LLM+RAG）为例实现了金融知识库问答（参考aistudio上精品项目）；章节三推荐了数个综合级、系统化的项目（适合从事、预从事 LLM/AIGC 岗的人群食用），每个项目深挖吃透后，基本可以从事相关岗位的工作。

2024-04-01 15:07:36 880 2

原创 Kaggle量化比赛复盘: Optiver - Trading at the Close

基于集合竞价开始以来经过 N 秒的行情数据，进行target预测。（科学上网）

2024-03-28 17:36:21 1089 1

原创大模型学习路线（9）——AIGC其它相关技术

博主没力气写了，快被csdn榨干了，这个章节就推几篇系统化的还不错的文章吧......AIGC技术相关的demo可以在HuggingFace、Modelscope、PaddlePaddle等各大社区找到。

2024-03-22 16:14:16 804 1

原创大模型学习路线（6）——分布式并行 & DeepSpeed

分布式并行分数据并行、模型并行（张量并行、流水并行）、多维混合并行三类。

2024-03-22 15:40:25 1185 1

（Frankly speaking，博主太懒了）章节一只对CLIP、BLIP、BLIP2、InstructBLIP进行了整理，章节二以CLIP、VisualGLM作为实践案例。实际上多模态模型除了CLIP、BLIP、BLIP2、InstructBLIP，还有LLaVA、miniGPT4，以及国内清华的VisualGLM、阿里的Qwen-VL等。（更多多模态原理可以看文末的参考说明）一、多模态模型 & 理论。

2024-03-21 22:46:22 1263 1

原创大模型学习路线（4）——大模型微调

图1. 大模型微调技术分类一、微调分类章节一对从微调参数规模、训练流程、训练方式三个角度对微调进行不同的划分，然后对每一分类的每一微调方法进行说明。章节二以github上的Baichuan+LoRA微调源码为例，分析了LLM微调的关键代码。

2024-03-20 16:44:43 2303 1

原创大模型学习路线（3）——知识检索增强（RAG）

上图为LLM+RAG运行的整体流程。如果想对RAG有系统化的理论认知，基本看如下三篇技术概览足矣，其它不再多做赘述了，毕竟没必要重复造轮子(bushi。章节一的三篇技术概览了RAG理论部分，从RAG整体流程介绍，到RAG流程涉及每一步骤的细节详解、常用技术，再到总结、当下发展、未来展望。章节二为进阶部分，介绍了RAG的关键技术。章节三介绍了RAG的实践，RAG之前跑的demo忘保存了，找时间补回来，留个坑位先......（饼先搁这画上了）。RAG内容为LLM岗重点考察内容，涉及知识点多的嘞！！！

2024-03-19 18:39:36 1161

原创大模型学习路线（1）——大模型基座 & 大模型部署

Llama:Github:ChatGLMGithub:BaichuanGithub:Qwen提示：以下是本篇文章正文内容，下面案例可供参考章节一引用《大模型升级与设计之道：ChatGLM、LLAMA、Baichuan及LLM结构解析》一文，该文章从原理、性能、差异、迭代版本系统地介绍了现在较受欢迎的LLM（目前ChatGLM4、Baichuan3已闭源）。章节二以Llama2举例，演示了从部署环境查询、其次模型部署、再到微调、最后到LangChain外挂知识库实现向量检索增强（RAG）的流程。

2024-03-19 16:48:48 1654 1

原创 AIGC落地产品（一）——AIGC+数字人

图引用自:讯飞智作-一站式在线音视频制作和AI创作工具。(xfyun.cn)（文章摘自 https://virtual-man.xfyun.cn/products/aiomachine ）虚拟人智能交互机支持虚拟人形象、服装、声音定制，支持专业知识库定制、支持系统界面样式自定义、支持展现形式自定义等。

2024-03-19 14:32:19 391

原创大模型学习路线

大模型学习路线

2024-03-18 11:38:30 1028 3

qq_51175703的博客