大模型补充知识

1. 资源站点

  • 模型权重:modelscope
  • 应用代码:github

2. 下载模型

  • Base: Qwen1.5-0.5B
  • Chat: Qwen1.5-0.5B-Chat

3. 开发范式

  • 传统深度学习:

    • 针对某个具体的问题
    • 搭建针对性的模型
    • 采集针对性的数据
    • 训练模型
    • 模型评估
    • 模型部署
  • 大模型时代:

    • 1,预训练一个不针对任何任务的模型

      • 大量的数据和时间
      • 自监督学习
      • base 底座大模型
    • 2,SFT 针对特定任务的微调

      • 对齐人类说话风格
      • 对齐行业知识
      • 对齐多轮对话
      • 对齐价值观/意识形态
    • 3,RLHF 基于人类反馈的强化学习

      • 进一步做上述对齐

4. 大模型时代,开发者能干什么?

  • 一句话:把公共大模型(大公司产品,开源大模型)变成私有(行业,领域,个人)大模型

  • 原因:

    • 数据安全
    • 行业知识
    • 费用问题
    • 系统集成
  • 策略

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值