1.基础
模型的使用
1.1 大模型是什么?为什么可以回答问题?
- 大模型生成文本的原理是什么?
1.2. 大模型有多大?Qwen 7b,Llama 8b,deepseek 671b指的是什么?
1.3. 如果我想使用开源的大模型,有哪些方法?
1.4. 使用闭源的大模型,有哪些方法?
第三方api,插件有试用
1.5 模型的框架
langchain、llamaindex、coze、dify
2.进阶
大模型使用存在哪些问题
- 不适配下游
- 幻觉
- 不能及时更新参数,不了解实时新闻
- (所以模型现在有联网搜索的功能)
2.1 RAG
2.2 模型微调SFT
2.3 强化学习