自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 vllm部署qwen1.5

此镜像需要自己安装vllm,也可拉取官方镜像,但只可开启类openai api服务。部署openai风格的 api服务。

2024-04-18 16:38:25 1014 1

原创 Tensorrt-llm加速qwen1.5-14b-chat推理

设置为inflight_fused_batching用于开启流推理,设置inflight_batching 需要转换模型时设置use_inflight_batching 和 paged_kv_cache ,默认为 v1;,将表格里面的变量填好(文件 triton_model_repo/tensorrt_llm/config.pbtxt),比如batch_size,是否开启流等,每个版本略有不同,可以自行斟酌,此处不再过多论述。hf_model_dir : 本地模型的路径。

2024-04-10 15:26:13 1000 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除