用google colab t4部署phi2(公网可访问)

本文介绍了如何在GoogleColab中配置GPU,通过ngrok获取authtoken,安装必要的包,运行推理服务生成公网地址,并使用client.py调用服务,最后展示如何将服务转换为Gradio界面版,以实现交互式问题解答。
摘要由CSDN通过智能技术生成

目录

1.打开google colab,配置GPU

2.ngrok获取authtoken

3.安装所需的包​编辑

4.运行推理服务,生成公网地址

5.client.py访问上述推理服务

6.gradio界面版


1.打开google colab,配置GPU

2.ngrok获取authtoken

https://dashboard.ngrok.com/get-started/your-authtoken

3.安装所需的包

4.运行推理服务,生成公网地址

生成的ngrok-free.app链接就是推理服务的公网地址

5.client.py访问上述推理服务

import requests

def format_prompt(prompt: str) -> str:
    return f'##提问:\n{prompt}\n##回答:\n'


def ask_phi2(query: str) -> str:
    url = "http://1111-11-111-11-11.ngrok-free.app/generate"
    
    body = {
        "query": format_prompt(query)
    }
    response = requests.post(url=url, json=body)
    if response.status_code == 200:
        print("Response from server:", response.text)
    else:
        print("Failed to get response from server, status code:", response.status_code)


if __name__ == '__main__':   
    ask_phi2("你好") 


    
    

6.gradio界面版

  • 11
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值