intro to LLM
- 大模型发展路线图
- 做了个导图简单汇总 开源和闭源大模型
intro to langchain
langchain 架构图
找到了一张很好的图,清晰地说明了langchain的六个核心模块分别是干啥的,以及相互怎么交互
相关的链接 Modules | 🦜️🔗 Langchain
下面我依据图来做一个langchain架构的解析
6 个核心模块组成:
- (Model I/O):以prompt来处理LLM的输入(模板template等)和输出(调整格式)
- (Data connection):从网络or向量数据库中检索文本并分割成小块(LLM处理长度有限)
- (Chains):Let LLM process step by step. 如此可以形成流水线,加快效率
- (Memory):主要用于维护LLM的短期记忆(其实就是上下文状态)
- (Agents):最早应该是起源于论文ReAct,让LLM在文字推理中学会调用一下外部api (感兴趣的可以看之后的文章,toolformer和graph-toolformer等)
- (Callbacks):跟踪大模型的状态等,例如其参数verbose就是对应一个回调函数