大模型补充知识

1. 资源站点

  • 模型权重:modelscope
  • 应用代码:github

2. 下载模型

  • Base: Qwen1.5-0.5B
  • Chat: Qwen1.5-0.5B-Chat

3. 开发范式

  • 传统深度学习:

    • 针对某个具体的问题
    • 搭建针对性的模型
    • 采集针对性的数据
    • 训练模型
    • 模型评估
    • 模型部署
  • 大模型时代:

    • 1,预训练一个不针对任何任务的模型

      • 大量的数据和时间
      • 自监督学习
      • base 底座大模型
    • 2,SFT 针对特定任务的微调

      • 对齐人类说话风格
      • 对齐行业知识
      • 对齐多轮对话
      • 对齐价值观/意识形态
    • 3,RLHF 基于人类反馈的强化学习

      • 进一步做上述对齐

4. 大模型时代,开发者能干什么?

  • 一句话:把公共大模型(大公司产品,开源大模型)变成私有(行业,领域,个人)大模型

  • 原因:

    • 数据安全
    • 行业知识
    • 费用问题
    • 系统集成
  • 策略:

    • 1,修改模型参数的:

      • PT
      • SFT
      • RLHF
      • 知识注入进模型
    • 2,不修改模型参数的:

      • RAG:检索 - 增强 - 生成
      • 知识没有注入模型,作为一个外挂使用
      • 丰富了问题的上下文
    • 3,让大模型干一些超出人工智能范畴的事情

      • 外挂外部工具
      • agent

5. 如何微调大模型?

6. 量化

  • float64 双精度
  • float32 单精度
  • float16 半精度
  • int8 量化
  • int4 量化
  • int2 量化

7. 模型高性能部署

import os
from openai import OpenAI

base_url = "https://4.0.wokaai.com/v1/"
api_key = "sk-HYypXkTBP8cMfJKK2390D0Ff681949A6Bf13887c5f9544B7"

client = OpenAI(
    # This is the default and can be omitted
    base_url=base_url,
    api_key=api_key
)

chat_completion = client.chat.completions.create(
    messages=[
        {
            "role": "user",
            "content": "中国的首都在哪",
        }
    ],
    model="gpt-4",
)

response = chat_completion.choices[0].message.content

  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值