RAG | Llama3|The Thing AI云服务器

Step1 注册云服务器

云服务平台:https://www.onethingai.comAI 算力平台icon-default.png?t=N7T8https://console.onethingai.com/dashboard

  1. 选择AI实验室
  2. 选择AI训练模块
  3. 深度学习框架自选
应用创建成功示例
  • 如果后续需要部署的模型较大的话需要扩充数据盘
  • 提前计算好需要的GPU资源,超出规模需要重新创建应用
  • 不量化8b量化4b量化
    Qwen1.5-110B-Chat215G113G62G
    Qwen1.5-72B-Chat150左右80左右40左右


Step2 部署Ollama

  • ollama是一个大模型快捷部署工具
  • 根据官网提供的指令直接进行下载即可
    curl -fsSL https://ollama.com/install.sh | sh

 Tips1 Ollama默认路径修改,防止系统盘挤爆

Olllama默认保存系统盘,然鹅这个云服务器的系统盘非常小,要修改一下配置

(base) root@instance:~/onethingai-tmp/llama# ollama serve --help
Start ollama

Usage:
  ollama serve [flags]

Aliases:
  serve, start

Flags:
  -h, --help   help for serve

Environment Variables:

    OLLAMA_HOST         The host:port to bind to (default "127.0.0.1:11434")
    OLLAMA_ORIGINS      A comma separated list of allowed origins
    OLLAMA_MODELS       The path to the models directory (default "~/.ollama/models")
    OLLAMA_KEEP_ALIVE   The duration that models stay loaded in memory (default "5m")
    OLLAMA_DEBUG        Set to 1 to enable additional debug logging
(base) root@instance:~/onethingai-tmp/llama# 

通过帮助页面可见,环境变量OLLAMA_MODELS和存储路径相关

  1. 修改配置文件
    路径:etc/systemd/system/ollama.service
    增加两行环境变量
    Environment="OLLAMA_HOST=0.0.0.0"
    Environment="OLLAMA_MODELS=/root/onethingai-tmp/llama/model"
  2. export临时变量
    export LLAMA_MODELS=
    
  3.  关闭ollama并重启
    ps -ef|grep ollama
    kill pid
                   一套操作下来,文件就可以顺利被下载到数据盘了,记得扩容

Step3   部署LLAMA中文版

  • LLAMA官方版本中文能力一塌糊涂,因此我们可以先部署一个llama3中文版

  • 在hugging face直接选择了一个上升趋势比较快的
  • 甚至已经提供了ollama部署的代码
ollama run wangshenzhi/llama3-70b-chinese-chat-ollama-q4:latest
ollama run wangshenzhi/llama3-70b-chinese-chat-ollama-q8:latest

Tips2 无卡启用,节省成本

隐藏有无卡启用选项
  • 模型下载这些可以选择无卡启用,十分便宜,一天2.5元
  • 按钮非常隐蔽,可恶

Step4 RAG

本次实验主要目的在于测试RAG对大模型的影响,先选用一个文本数据集进行测试

  • 小规模文本数据集
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值