对于LLM而言,目前主要流行的分两块:
- 开源:这里主要以llmam系列为主,以及后续的各种衍生品
- 闭源:以chatgpt claud为代表产品,虽然开放了一些api调用接口,但是收费。
(1)LLM
下面所有操作都是基于开源llama模型而言,当需要对自己所在方向做一个垂直领域大模型,则一般需要以下操作:
- 选取base_model
- 对其进行微调,这里分两块,RAG(检索增强生成)和精调(fine-tuning)技术
- RLHF(基于人类反馈的强化学习 ,也就是模型对齐)
对于LLM而言,目前主要流行的分两块:
下面所有操作都是基于开源llama模型而言,当需要对自己所在方向做一个垂直领域大模型,则一般需要以下操作: