oneAPI人工智能黑客松

最新推荐文章于 2024-05-03 09:20:19 发布

兰清皓

最新推荐文章于 2024-05-03 09:20:19 发布

阅读量246

点赞数

文章标签：人工智能 oneapi 深度学习

本文链接：https://blog.csdn.net/weixin_62100203/article/details/131386930

版权

本文介绍了参加Intel oneAPI人工智能黑客松的经历，利用oneAPI的Pytorch扩展IPEX对alpaca-lora推理进行加速。alpaca-lora是基于LLaMA模型的轻量级微调方案。通过IPEX，能够在CPU上实现比原版推理更快的速度，减少了约12%的时间。

摘要由CSDN通过智能技术生成

最近参加了Intel 2023 oneAPI 人工智能黑客松比赛。这次比赛有三个赛道，我选择的是赛道3: 使用oneAPI人工智能分析工具包实现任何创意。我的创意是利用oneAPI里面的Pytorch 扩展（IPEX ）来对alpaca-lora 推理进行加速。

Stanford Alpaca 是在 LLaMA 整个模型上微调，即对预训练模型中的所有参数都进行微调（full fine-tuning）。Alpaca-Lora 则是利用 Lora 技术，在冻结原模型 LLaMA 参数的情况下，通过往模型中加入额外的网络层，并只训练这些新增的网络层参数。由于这些新增参数数量较少，这样不仅微调的成本显著下降，还能获得和全模型微调（full fine-tuning）类似的效果。