datawhale[动手学大模型应用开发]打卡1：大模型简介

最新推荐文章于 2024-07-22 16:24:23 发布

Nano3

最新推荐文章于 2024-07-22 16:24:23 发布

阅读量387

点赞数 4

分类专栏： datawhale打卡文章标签：笔记人工智能深度学习

本文链接：https://blog.csdn.net/H_1008/article/details/139810885

版权

datawhale打卡专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本博客为Datawhale的动手学大模型应用开发的学习笔记。

1.大型语言模型（LLM）理论简介

这一章节总结了LLM的概念和发展历程，并主要介绍几个国内外常见的大模型（包括开源和闭源），非常全面。
闭源：

模型	链接
ChatGPT	https://chat.openai.com/
Claude	https://claude.ai/chats
Gemini	https://gemini.google.com/
文心一言	https://yiyan.baidu.com/
星火大模型	https://xinghuo.xfyun.cn/

开源：

模型	链接
LLaMA 系列	https://llama.meta.com/
通义千问	https://tongyi.aliyun.com/
GLM 系列	https://chatglm.cn/
Baichuan	https://www.baichuan-ai.com/chat

2.检索增强生成 RAG 简介

之前一直很想找到一个全面总结RAG 和微调的对比，刚好这次学习内容就总结了！
在这里插入图片描述

3.LangChain

LangChain 框架是一个开源工具，充分利用了大型语言模型的强大能力，以便开发各种下游应用。它的目标是为各种大型语言模型应用提供通用接口，从而简化应用程序的开发流程。具体来说，LangChain 框架可以实现数据感知和环境互动，也就是说，它能够让语言模型与其他数据来源连接，并且允许语言模型与其所处的环境进行互动。

在下图中，每个椭圆形代表了 LangChain 的一个模块，例如数据收集模块或预处理模块。每个矩形代表了一个数据状态，例如原始数据或预处理后的数据。箭头表示数据流的方向，从一个模块流向另一个模块。在每一步中，LangChain 都可以提供对应的解决方案，帮助我们处理各种任务。
在这里插入图片描述