【OrangePi】(2):香橙派OrangePi AIpro设备,安装xinference框架,运行qwen1.5大模型,api接口测试,速度不错,设备也非常精致!

1,拿到了新设备

演示视频地址:
https://www.bilibili.com/video/BV1QJ4m1w7QK/

非常高兴!

【OrangePi】(2):香橙派OrangePi AIpro设备,安装xinference框架,运行qwen1.5大模型

img

img

# cat /proc/cpuinfo 
processor	: 0
BogoMIPS	: 96.00
Features	: fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop sha3 asimddp sha512 sve asimdfhm ssbs sb
CPU implementer	: 0x00
CPU architecture: 8
CPU variant	: 0x1
CPU part	: 0xd02
CPU revision	: 2

processor	: 1
BogoMIPS	: 96.00
Features	: fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop sha3 asimddp sha512 sve asimdfhm ssbs sb
CPU implementer	: 0x00
CPU architecture: 8
CPU variant	: 0x1
CPU part	: 0xd02
CPU revision	: 2

processor	: 2
BogoMIPS	: 96.00
Features	: fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop sha3 asimddp sha512 sve asimdfhm ssbs sb
CPU implementer	: 0x00
CPU architecture: 8
CPU variant	: 0x1
CPU part	: 0xd02
CPU revision	: 2

processor	: 3
BogoMIPS	: 96.00
Features	: fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop sha3 asimddp sha512 sve asimdfhm ssbs sb
CPU implementer	: 0x00
CPU architecture: 8
CPU variant	: 0x1
CPU part	: 0xd02
CPU revision	: 2

2,配置好wifi远程登陆

默认的官方镜像已经配置好了ssh服务,可以直接远程登陆即可。直接使用root进行登陆就行。

ssh root@192.168.1.110
默认密码是:Mind@123

img

3,安装xinference库和llama-cpp-python

ssh root@192.168.1.110

# 安装xinf 和 llama.cpp 库
pip3 install xinference llama-cpp-python

# 设置环境变量,放到U-pan中
export HF_ENDPOINT=https://hf-mirror.com
export XINFERENCE_MODEL_SRC=modelscope
export XINFERENCE_HOME=/media/HwHiAiUser/data

xinference-local --host 0.0.0.0 --port 9997

img

4,运行qwen-1.5-0.5b大模型:

img

运行成功:
img

可以使用stream 执行:


curl -X 'POST' 'http://192.168.1.110:9997/v1/chat/completions' -H 'Content-Type: application/json' -d '{
    "model": "qwen1.5-chat","stream": true,
    "messages": [
        {
            "role": "user",
            "content": "北京景点?"
        }
    ],
    "max_tokens": 512,
    "temperature": 0.7
}'

速度还可以

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值