大模型补充知识

马斯洛金字塔下的小灵猴儿

于 2024-07-15 16:50:16 发布

阅读量419

点赞数 5

分类专栏： # 自然语言处理文章标签：人工智能大模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GOOD_CODER/article/details/140443199

版权

1. 资源站点

模型权重：modelscope
应用代码：github

2. 下载模型

Base: Qwen1.5-0.5B
Chat: Qwen1.5-0.5B-Chat

3. 开发范式

传统深度学习：
- 针对某个具体的问题
- 搭建针对性的模型
- 采集针对性的数据
- 训练模型
- 模型评估
- 模型部署
大模型时代：
- 1，预训练一个不针对任何任务的模型
  - 大量的数据和时间
  - 自监督学习
  - base 底座大模型
- 2，SFT 针对特定任务的微调
  - 对齐人类说话风格
  - 对齐行业知识
  - 对齐多轮对话
  - 对齐价值观/意识形态
- 3，RLHF 基于人类反馈的强化学习
  - 进一步做上述对齐

4. 大模型时代，开发者能干什么？

一句话：把公共大模型（大公司产品，开源大模型）变成私有（行业，领域，个人）大模型
原因：
- 数据安全
- 行业知识
- 费用问题
- 系统集成
策略

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。