测试一下 Meta Llama3-70b-Instruct-q8

测试一下 Meta Llama3-70b-Instruct-q8

0. 引言

今天,Meta 正式介绍Meta Llama 3,Meta 开源大型语言模型的下一代产品。
这次发布包括具有80亿(8B)和700亿(70B)参数的预训练和经过指令细化训练的语言模型,可以支持广泛的应用场景。

Meta 发布 Llama 3的性能看起来也不错,那今天就简单测试一下Llama3-70b-Instruct-q8(注:运行单精度Llama3-70b-Instruct对硬件要求太高,所以基于8bit量化的模型进行测试,实际效果肯定比单精度的效果差一些,所以测试结果仅供参考)

在这里插入图片描述

1. 测试 Meta Llama3-70b-Instruct-q8

题目是我之前写的 让 OpenAI GPT4 出 10 道题测试其他开源大语言模型

无图无真相,直接上截图,这样大家也可以自行判断一下效果。

  1. 一个矩形的长是10厘米,宽是5厘米,求它的面积。
    在这里插入图片描述

  2. 中国的四大发明是什么?
    在这里插入图片描述

  3. 世界上最高的山是什么?
    在这里插入图片描述

  4. 牛顿第二运动定律是什么?
    在这里插入图片描述

  5. 水的化学式是什么?
    在这里插入图片描述

  6. DNA的全称是什么?
    在这里插入图片描述

  7. 《红楼梦》的作者是谁?
    在这里插入图片描述

  8. 太阳系中最大的行星是哪一个?
    在这里插入图片描述

  9. 乒乓球起源于哪个国家?
    在这里插入图片描述

  10. 世界上第一台电脑是什么?
    在这里插入图片描述

完结!

### 部署 LLaMA-3-70B-Instruct 模型使用 vLLM 框架 为了成功部署 LLaMA-3-70B-Instruct 模型,需遵循特定配置和环境设置。vLLM 是一种高效的推理引擎,专为大型语言模型设计。 #### 安装依赖库 首先安装必要的 Python 库,确保环境中具备运行 vLLM 所需的支持工具: ```bash pip install --upgrade pip setuptools wheel pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu118 pip install vllm ``` #### 下载模型权重文件 由于 LLaMA-3-70B-Instruct 属于较新的大尺寸模型版本,在获取其参数时可能需要特别权限[^2]。一旦获得授权,则可以通过 Hugging Face 或其他指定渠道下载对应的模型权重。 #### 加载并启动服务端口 创建一个简单的脚本来加载模型,并通过 HTTP API 提供预测功能: ```python from vllm import LLM, SamplingParams # 初始化 LLaMA-3-70B-Instruct 实例 model_path = "/path/to/model/directory" llm = LLM(model=model_path) # 设置采样参数 sampling_params = SamplingParams(temperature=0.8, top_p=0.95) # 启动 RESTful 接口监听外部请求 app.run(host='0.0.0.0', port=8080) ``` 上述代码片段展示了如何利用 `vllm` 来初始化 LLaMA-3-70B-Instruct 并设定基本的生成控制选项[^1]。 #### 测试接口响应速度 完成以上步骤之后,可以编写客户端测试程序验证服务器是否正常工作以及性能表现情况: ```python import requests url = 'http://localhost:8080/generate' data = {"prompt": "Once upon a time", "max_tokens": 50} response = requests.post(url, json=data).json() print(response['text']) ``` 此部分演示了向已部署的服务发送 POST 请求的方式,从而实现文本补全等功能[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值