本博客为Datawhale的动手学大模型应用开发的学习笔记。
1.大型语言模型(LLM)理论简介
这一章节总结了LLM的概念和发展历程,并主要介绍几个国内外常见的大模型(包括开源和闭源),非常全面。
闭源:
模型 | 链接 |
---|---|
ChatGPT | https://chat.openai.com/ |
Claude | https://claude.ai/chats |
Gemini | https://gemini.google.com/ |
文心一言 | https://yiyan.baidu.com/ |
星火大模型 | https://xinghuo.xfyun.cn/ |
开源:
模型 | 链接 |
---|---|
LLaMA 系列 | https://llama.meta.com/ |
通义千问 | https://tongyi.aliyun.com/ |
GLM 系列 | https://chatglm.cn/ |
Baichuan | https://www.baichuan-ai.com/chat |
2.检索增强生成 RAG 简介
之前一直很想找到一个全面总结RAG 和 微调的对比,刚好这次学习内容就总结了!
3.LangChain
LangChain 框架是一个开源工具,充分利用了大型语言模型的强大能力,以便开发各种下游应用。它的目标是为各种大型语言模型应用提供通用接口,从而简化应用程序的开发流程。具体来说,LangChain 框架可以实现数据感知和环境互动,也就是说,它能够让语言模型与其他数据来源连接,并且允许语言模型与其所处的环境进行互动。
在下图中,每个椭圆形代表了 LangChain 的一个模块,例如数据收集模块或预处理模块。每个矩形代表了一个数据状态,例如原始数据或预处理后的数据。箭头表示数据流的方向,从一个模块流向另一个模块。在每一步中,LangChain 都可以提供对应的解决方案,帮助我们处理各种任务。