前言
今天Datawhale的动手学大模型应用开发组队学习正式开始了,最近一直想学习做大模型的应用,另外还有一个训练营要参加,强度已经拉满了,希望接下来能一直保持学习,立个Flag
大模型的能力、特点
对于大模型的能力特点,训练营的介绍已经非常全面,跃升级的能力已经改变了这个行业,也在剧烈地改变各行各业
常见大模型
对于常见大模型的历程,国外主要是Openai领跑, Google, DeepMind和Meta跟跑
对于中文大模型,据开发了CHATALL的孙志岗大佬所述,他及他使用这些模型的部分朋友推荐:ChatGLM3,百川,通义,LLaMa-中文版(不知道是不是故意推荐的都是开源LLM)
LangChain
对于LangChain的发展历程,我们并不需要特别清楚,只需要知道地位是领头羊的即可。
根据官方文档,对于langchain核心组件的描述可以补充的是:
核心模块是:
- Model I/O:提供与语言模型进行交互的接口
- Retrieval:提供与特定应用程序的数据进行交互的接口
- Agents:让Chain根据高级指令选择使用哪些工具(更重要但是个人觉得Chain更核心)
额外模块是: - Chains:提供常见的、基础的组合块
- Memory:用于Chain的多次运行间持久化应用程序状态
- Callbacks:记录和流式传输任何Chain的中间步骤
根据官方文档的介绍,我利用ChatGPT对LangChain进行了产品整体及模块方面的总结:
为了方便展示,我将其转换为脑图
训练营学习文章地址: https://datawhalechina.github.io/llm-universe/#/
PS:ChatGPT的角色扮演确实好用,可以轻松总结很多英文文档,懒人又一次拯救了自己