qwen-1.5 gptq模型的依赖的推荐版本号

最新推荐文章于 2024-09-15 22:31:42 发布

atom32

最新推荐文章于 2024-09-15 22:31:42 发布

阅读量323

点赞数 2

文章标签： python nlp pip

本文链接：https://blog.csdn.net/atom311/article/details/137062837

版权

本文介绍了在使用GPTq量化的模型时，如qwen-1.5-14B，推荐的auto-gptq版本0.4.2和optimum版本1.13.1，同时指出transformers库需至少4.38.1版本。

摘要由CSDN通过智能技术生成

原因

使用gptq量化的模型，比如qwen-1.5-14B，对于auto-gptq 和optimum两个依赖有着版本要求。这里实验出的一个可行组合是：

auto-gptq==0.4.2
optimum==1.13.1
transformers==4.38.1 #在model card上写的是>=4.37.0

在这里稍微记录一下

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

atom32

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

开源模型应用落地-模型量化-Qwen1.5-7B-Chat-GPTQ-Int8（一）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

05-17

1万+

理解GPTQ模型量化技术，以低成本体验大语言模型的魅力

开源模型应用落地-qwen1.5-7b-chat-LoRA微调-Firefly（四）

热门推荐

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

04-02

1万+

使用开源的Firefly大模型训练项目微调qwen1.5-7b-chat模型

参与评论您还未登录，请先登录后发表或查看评论

千问Qwen1.5中GPTQ、AWQ量化模型

weixin_46437074的博客

04-15

2175

Qwen量化

Py之auto-gptq：auto-gptq的简介、安装、使用方法之详细攻略

近期请国内外头部出版社可尽快私信博主！——心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，谦虚，自律，反思，成长，还算是比较正能量的博主，公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然，有点小情怀，也有点使命感呀)…

10-31

7798

Py之auto-gptq：auto-gptq的简介、安装、使用方法之详细攻略目录 auto-gptq的简介 auto-gptq的安装 auto-gptq的使用方法 auto-gptq的简介 AutoGPTQ是一个易于使用的低延迟语言模型（LLM）量化软件包，具有用户友好的API，基于GPTQ算法。一个基于 GPTQ 算法，简单易用且拥有用户友好型接口的大语言模型量化工具包。 1、版本更新历史 2023-08-23 - (新闻) - �� Transformers、opti

Qwen最新开源14B，同级别SOTA，github页面

人工智能曾小健

09-25

1513

通过arXiv数据集上的语言模型实验，我们的原生长度为2K的Qwen-7B/14B在8K的序列长度下依然表现不错，而原生长度扩展到8K的Qwen-7B能够在32K长序列的设置下取得不错的表现。在此基础上，我们针对LLM对接外部系统等方面针对性地做了优化，当前具备较强的工具调用能力，以及最近备受关注的Code Interpreter的能力和扮演Agent的能力。尤其注意，你需要在脚本中指定正确的模型名称或路径、数据路径、以及模型输出的文件夹路径。在他的领导下，公司迅速发展起来，成为了一家成功的科技企业。

【个人笔记】windows 安装bitsandbytes，auto-gptq

M2087的博客

06-21

3288

aoto-gptq目前好像只支持cuda11.7和11.8。怒...我的cuda11.6重装了(虽然并没有很麻烦)

【LLM之基座】qwen 14b-4int 部署踩坑

11-17

4623

由于卡只有24G，qwen14b 原生需要 30GB，按照官方团队的说法，他们用的量化方案是基于AutoGPTQ的，而且根据评测，量化之后的模型效果在几乎没有损失的情况下，显存降低到13GB，妥妥穷狗福音，说干就干。

开源模型应用落地-Qwen2-7B-Instruct-GPTQ-Int4与vllm-单机多卡-RTX 4090双卡（十二）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-07

9264

4090单机双卡部署vllm，并集成qwen2-7b-instruct-gptq-int4

开源模型应用落地-qwen1.5-7b-chat与vllm实现推理加速的正确姿势（八）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

03-01

2387

qwen1.5-7b-chat集成vllm，流式输出

算法部署-使用TensorRT-LLM部署通义千问Qwen-7B大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip

03-06

算法部署_使用TensorRT-LLM部署通义千问Qwen-7B大模型_附详细优化+分析流程教程_优质大模型部署项目实战

通义千问Qwen微调量化实战

IT大头的博客

01-26

3111

本文主要内容是对于Qwen量化实战演练，将深入探讨两种不同的量化方法：分别是使用官方量化后的int4模型进行微调，得到模型理论上也是量化后的微调模型，另一种则是使用官方全量模型进行微调，再将微调后的模型进行自主量化。ps:作者认为如果真实场景使用的话建议使用第一种，第二只是用于了解即可，而且自己去量化模型bug百出，费时费力。

大语言模型量化方法对比：GPTQ、GGUF、AWQ

deephub

11-16

5516

在过去的一年里，大型语言模型(llm)有了飞速的发展，在本文中，我们将探讨几种(量化)的方式，除此以外，还会介绍分片及不同的保存和压缩策略。说明：每次加载LLM示例后，建议清除缓存，以防止出现OutOfMemory错误。如果在jupyter中无法释放显存，请重启这个jupyter notebook。

LLM 大模型学习必知必会系列(六)：量化技术解析、QLoRA技术、量化库介绍使用（AutoGPTQ、AutoAWQ）

丨汀、的博客

05-22

1291

LLM 大模型学习必知必会系列(六)：量化技术解析、QLoRA技术、量化库介绍使用（AutoGPTQ、AutoAWQ）

Python世界：力扣29题两数相除算法实践

来知晓的博客

09-13

375

除法运算本质是减法，从理解原理到真正实现还是有距离，建议初步理解后，不参考任何代码，完全自己复现一遍，体会更深。注意提示：目的就是提醒越界问题：-2^31/-1=2&31，超过了整数表达范围。本问题来自于力扣29题，在做完大数相乘后，顺带也看下两数相除。将两数相除，要求不使用乘法、除法和 mod 运算符。给定两个整数，被除数。

Python办公自动化案例（二）：对比两个Excel数据内容并标出不同

衍生星球的博客

09-14

335

在数据处理和分析的日常工作中，我们经常需要比较两个Excel文件的差异。这可能是为了验证数据的一致性、检查数据的准确性，或者在版本控制中追踪更改。手动比较这些文件不仅耗时，而且容易出错。幸运的是，Python的openpyxl库提供了一种自动化这一过程的方法。

Tcl lnit error: Can’t find a usable init.tcl in the following directories 问题解决

最新发布

梦想闹钟

09-15

271

实际研究后发现，其实py2exe已经把打包需要的lib放在dist文件夹下了，但是打包后的程序运行后却没有去lib下找，而是去找系统自带的环境变量里找，所以找不到。这个问题出现在我用py2exe打包了一个包含tkinter的图形化界面，在当前电脑上运行无问题，在移动到新电脑上后提示报错、getcwd用于获取当前工作目录绝对路径，在设置环境的变量的时候它用的是绝对路径-所以也导致了在当前电脑上能用而移动后不能用。解决方法是在你的程序里重新设置下环境变量，而且是用相对路径的形式。

JUC从实战到源码：中断机制与API实现

qq_43843951的博客

09-12

1135

在Java中，线程中断是一种机制，用于通知线程应该停止当前正在执行的任务。中断通常用于协同线程之间的合作，以便让线程在适当的时候终止其工作，尤其是在长时间运行的任务或阻塞操作中。通过学了多线程以及synchronized的相关知识，接下来就到了学习线程中断知识。

面试真题 | web自动化关闭浏览器，quit()和close()的区别

NHB234567的博客

09-13

312

关闭所有的浏览器窗口，销毁driver操作，则需要使用的是quit方法；当打开了多个窗口，只想要关闭非最后一个窗口的时候，使用的是close方法。这些资料，对于【软件测试】的朋友来说应该是最全面最完整的备战仓库，这个仓库也陪伴上万个测试工程师们走过最艰难的路程，希望也能帮助到你！close():只关闭当前的浏览器标签页，如果当前浏览器标签页剩下最后一个，则所有标签页面退出。是否编写过对应浏览器退出的测试用例。quit():所有的浏览器窗口退出。关闭当前的标签页，其他窗口不退出。退出当前所有的窗口；

qwen2 1.5b

06-21

相较于之前的版本，Qwen 1.5B在参数量和训练数据上有了显著提升，这使得它在自然语言处理任务上具有更强的文本生成、理解和推理能力。它能够根据上下文提供更准确、流畅的回答，并且能够处理各种领域的问题。使用...