自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 大模型学习路线(11)——模型评测指标

第一章节介绍了机器学习(Machine Learning, ML)和深度学习(Deep Learning,DL)领域评估指标,包含分类任务、预测任务、回归任务、常用损失值;第二章节介绍了大语言模型(LLMs)领域评测指标;第三章节介绍了多模态(MLLMs)领域评估指标;第四章节介绍了知识召回业务领域的评估指标。

2024-05-17 16:21:28 758

原创 大模型学习路线(2)——数据工程(数据预处理)

该思维导图参考自ZOMI酱的B站视频整理而来,数据预处理/数据工程全栈式的思维导图如下:视频链接1:​​​​​​​ZOMI酱的个人空间-ZOMI酱个人主页-哔哩哔哩视频 (bilibili.com)视频链接2:​​​​​​​向量数据库介绍,Vector和Embedding关系 #大模型 #向量数据库_哔哩哔哩_bilibili。

2024-05-16 18:56:17 463 1

原创 大模型学习路线(5)—— 大模型压缩(量化、剪枝、蒸馏、低秩分解),推理(vllm)

一、模型压缩目标:(1)减少模型显存占用;(2)加快推理速度;(3)减少精度损失。二、模型压缩算法分类(如何降低权重和激活成本):(1)模型量化(quantization(2)参数剪枝(pruning)(3)知识蒸馏(knowledge distillation)

2024-05-05 20:31:54 1144 3

原创 表征学习/迁移学习/预训练模型

多模态/表征学习/迁移学习/模型预训练

2024-04-18 14:44:56 495 1

原创 大模型学习路线(10)——入门项目推荐

章节一呈现了一个入门级demo(小白友好),以VisualGLM(多模型大模型)为例实现了图生文;章节二呈现了一个进阶版demo(适合有一定LLM基础的人群食用),以文心大模型(LLM+RAG)为例实现了金融知识库问答(参考aistudio上精品项目);章节三推荐了数个综合级、系统化的项目(适合从事、预从事 LLM/AIGC 岗的人群食用),每个项目深挖吃透后,基本可以从事相关岗位的工作。

2024-04-01 15:07:36 880 2

原创 Kaggle量化比赛复盘: Optiver - Trading at the Close

基于集合竞价开始以来经过 N 秒的行情数据,进行target预测。(科学上网)

2024-03-28 17:36:21 1089 1

原创 大模型学习路线(9)——AIGC其它相关技术

博主没力气写了,快被csdn榨干了,这个章节就推几篇系统化的还不错的文章吧......AIGC技术相关的demo可以在HuggingFace、Modelscope、PaddlePaddle等各大社区找到。

2024-03-22 16:14:16 804 1

原创 大模型学习路线(6)——分布式并行 & DeepSpeed

分布式并行分数据并行、模型并行(张量并行、流水并行)、多维混合并行三类。

2024-03-22 15:40:25 1185 1

原创 大模型学习路线(7)——多模态模型

(Frankly speaking,博主太懒了)章节一只对CLIP、BLIP、BLIP2、InstructBLIP进行了整理,章节二以CLIP、VisualGLM作为实践案例。实际上多模态模型除了CLIP、BLIP、BLIP2、InstructBLIP,还有LLaVA、miniGPT4,以及国内清华的VisualGLM、阿里的Qwen-VL等。(更多多模态原理可以看文末的参考说明)一、多模态模型 & 理论。

2024-03-21 22:46:22 1263 1

原创 大模型学习路线(4)——大模型微调

图1. 大模型微调技术分类一、微调分类章节一对从微调参数规模、训练流程、训练方式三个角度对微调进行不同的划分,然后对每一分类的每一微调方法进行说明。章节二以github上的Baichuan+LoRA微调源码为例,分析了LLM微调的关键代码。

2024-03-20 16:44:43 2303 1

原创 大模型学习路线(3)——知识检索增强(RAG)

上图为LLM+RAG运行的整体流程。如果想对RAG有系统化的理论认知,基本看如下三篇技术概览足矣,其它不再多做赘述了,毕竟没必要重复造轮子(bushi。章节一的三篇技术概览了RAG理论部分,从RAG整体流程介绍,到RAG流程涉及每一步骤的细节详解、常用技术,再到总结、当下发展、未来展望。章节二为进阶部分,介绍了RAG的关键技术。章节三介绍了RAG的实践,RAG之前跑的demo忘保存了,找时间补回来,留个坑位先......(饼先搁这画上了)。RAG内容为LLM岗重点考察内容,涉及知识点多的嘞!!!

2024-03-19 18:39:36 1161

原创 大模型学习路线(1)——大模型基座 & 大模型部署

Llama:Github:ChatGLMGithub:BaichuanGithub:Qwen提示:以下是本篇文章正文内容,下面案例可供参考章节一引用《大模型升级与设计之道:ChatGLM、LLAMA、Baichuan及LLM结构解析》一文,该文章从原理、性能、差异、迭代版本系统地介绍了现在较受欢迎的LLM(目前ChatGLM4、Baichuan3已闭源)。章节二以Llama2举例,演示了从部署环境查询、其次模型部署、再到微调、最后到LangChain外挂知识库实现向量检索增强(RAG)的流程。

2024-03-19 16:48:48 1654 1

原创 AIGC落地产品(一)——AIGC+数字人

图引用自:讯飞智作-一站式在线音视频制作和AI创作工具。(xfyun.cn)(文章摘自 https://virtual-man.xfyun.cn/products/aiomachine )虚拟人智能交互机支持虚拟人形象、服装、声音定制,支持专业知识库定制、支持系统界面样式自定义、支持展现形式自定义等。

2024-03-19 14:32:19 391

原创 大模型学习路线

大模型学习路线

2024-03-18 11:38:30 1028 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除