在window10下使用directml加速phi-3模型的一些记录

i_saw_you

于 2024-10-06 15:00:59 发布

阅读量407

点赞数 9

分类专栏：技術文章标签： python torch DirectML PyTorch phi-3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/i_saw_you/article/details/142726829

版权

技術专栏收录该内容

42 篇文章 0 订阅

订阅专栏

1.安装anaconda，安装python 安装torch等参考网上资料非常多不细描述

2.参考微软官网【在windows上通过DirectML启用Pytorch文档，检查系统版本检查gpu版本

3.参考微软官网【在windows上通过DirectML启用Pytorch】文档，安装torch_directml模块

4.参考微软官网【在windows上通过DirectML启用Pytorch】文档，验证设备是否可用。

5.下载phi-3模型

6.运行模型

import torch
import torch_directml
from transformers import Phi3Model,Phi3Config
from transformers import AutoTokenizer,pipeline
dml=torch_directml,device(0) #0为GPU设备index
torch.set_default_device(dml)
model_dir='./'  #模型所在文件路径
configuration = Phi3Config.from_pretrained(model_dir)
model=Phi3Model(configuration)

tokenizer = AutoTokenizer.from_pretrained(model_dir)

messages=[{"role":"system","content":"who are you"}]
pipe =pipeline("text-generation",model=model,tokenizer=tokenizer)

generation_args = {
"max_new_tokens":500,
"return_full_text",False,
"temperature":0.0,
"do_sample":False,
}
output = pipe(message,**generation_args)
print(output[0]['generated_text'])

有两点要特别讲一下，第一，可用使用 torch_directml.device_name(0)来查看具体使用的是哪个显卡。

第二，我有安装onnxruntime，但是好像不安装也可以，这点没有验证。

最后要说明一下，我上面的代码并没有进行完全验证，主要是在执行到加载模型处，因显卡内存不足，程序退出。

关注

9
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

i_saw_you CSDN认证博客专家 CSDN认证企业博客

码龄17年

186: 原创

2万+: 周排名

1万+: 总排名

11万+: 访问

: 等级

3074: 积分

84: 粉丝

87: 获赞

30: 评论

29: 收藏

私信

关注

热门文章

分类专栏

最新评论

jacob使用异常解决
i_saw_you: [code=java] app = new ActiveXComponent("Word.Application"); Dispatch document = null; Dispatch documents = app.getProperty("Documents").toDispatch(); document = Dispatch.call(documents,"Open",wordFile).toDispatch(); Dispatch selection = Dispatch.get(app, "Selection").toDispatch(); replace(selection,map); Dispatch.call(document, "SaveAs",outFile,new Variant(type.getI())); if(document != null) { Dispatch.call(document, "Close",Variant.VT_FALSE); document.safeRelease(); document =null; } Dispatch.call(app, "Quit"); app.safeRelease(); app =null; ComThread.Release(); [/code]
jacob使用异常解决
weixin_43878129: 具体修改方式，采用单例模式，每次调用时，初始化新的activeXCompent对象，在使用完毕后，调用safeRelease方法，依次释放所有Jacob对象，并在最后一步，调用comThread.Release()方法释放对象。大佬，这一段不太理解具体的做法，能不能参考一下您的代码啊，多谢
live555移植到android系统，参考某博客
m0_62347639: 太顶级了
soap 与jboss兼容性bug解决
winer360: 遥远的她，实在看不懂啊
tomcat8下面jndi配置bug
winer360: 奥利奥呀，来一袋啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。