phi-3_pytorch小型语言多轮对话模型(SLM）

技术瘾君子1573

于 2024-09-03 00:00:00 发布

阅读量568

点赞数 13

分类专栏：人工智能&深度学习&机器学习文章标签： pytorch 语言模型人工智能多轮对话

本文链接：https://blog.csdn.net/qq_27815483/article/details/141392137

版权

人工智能&深度学习&机器学习专栏收录该内容

136 篇文章 1 订阅

订阅专栏

Phi-3

论文

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

https://arxiv.org/abs/2404.14219

模型结构

基于transformer结构

算法原理

Phi-3 模型是目前功能最强大、性价比最高的小型语言模型 (SLM)，在各种语言、推理、编码和数学基准测试中，其表现优于同等规模和下一个规模的模型。此版本扩大了客户的高质量模型选择范围，为他们编写和构建生成式 AI 应用程序提供了更多实用选择。

环境配置

-v 路径、docker_name和imageID根据实际情况修改

Docker（方法一）

docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-ubuntu20.04-dtk24.04.1-py3.10

docker run -it --network=host --privileged=true --name=docker_name --device=/dev/kfd --device=/dev/dri --ipc=host --shm-size=32G --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -u root -v /path/your_code_data/:/path/your_code_data/ -v /opt/hyhal/:/opt/hyhal/:ro imageID /bin/bash

cd /your_code_path/phi-3_pytorch
pip install -r requirements.txt

Dockerfile（方法二）

cd ./docker
docker build --no-cache -t phi-3:latest .

docker run -it --network=host --privileged=true --name=docker_name --device=/dev/kfd --device=/dev/dri --ipc=host --shm-size=32G --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -u root -v /path/your_code_data/:/path/your_code_data/ -v /opt/hyhal/:/opt/hyhal/:ro imageID /bin/bash

cd /your_code_path/phi-3_pytorch
pip install -r requirements.txt

Anaconda（方法三）

关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装。

DTK驱动：dtk24.04.1
python：3.10
torch：2.1
vllm: 0.3.3

Tips：以上dtk驱动、python等DCU相关工具版本需要严格一一对应

其它非深度学习库参照requirements.txt安装：

pip install -r requirements.txt

数据集

暂无

训练

暂无

推理

# 指定显卡
export HIP_VISIBLE_DEVICES=0

python inference.py --model_path /path/of/model

result

精度

暂无

应用场景

算法类别

多轮对话

热点应用行业

家居,教育,科研

预训练权重

源码仓库及问题反馈

ModelZoo / Phi-3_pytorch · GitLab

参考资料

技术瘾君子1573

关注

13
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
phi-3_pytorch小型语言多轮对话模型(SLM）

Phi-3模型是目前功能最强大、性价比最高的小型语言模型(SLM)，在各种语言、推理、编码和数学基准测试中，其表现优于同等规模和下一个规模的模型。
复制链接

扫一扫

专栏目录