T-MAC在Windows(64)上的部署推理


前言

T-MAC是微软研究院提出的一种创新方法,通过查表法(LUT)在CPU上实现低比特LLM(即权重量化LLM)的高效推理

本文是初学者根据官方文档和网络资料调通T-MAC的过程以及遇到的问题

T-MAC github地址:GitHub - microsoft/T-MAC: Low-bit LLM inference on CPU with lookup table


一、安装环境和依赖

1.安装Conda + Visual studio

根据官方文档,在Windows上安装依赖推荐使用conda+visual studio的方式。

Anaconda下载地址:Download Anaconda Distribution | Anaconda

安装Visual Studio时注意选择使用C++的桌面开发,不要启用“适用于 Windows 的 C++ Clang 工具”,因为 Clang 版本可能不兼容。

因为我们要使用自定义的LLVM 工具集版本,因此需要在单个组件中搜索clang并将"对 LLVM (clang-cl) 工具集的 MSBuild 支持"选中

然后进行安装即可

2.安装Clang-17.0.6

下载地址:Download LLVM releases

在LLVM官网的下载页面找到17.0.6版本并进行下载

安装时注意选择将路径添加至所有用户的系统环境变量之中

安装后在高级系统设置

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值