【Torchserve部署YOLOX远程服务】

最新推荐文章于 2023-07-28 01:06:49 发布

jdddddp

最新推荐文章于 2023-07-28 01:06:49 发布

阅读量397

点赞数 1

文章标签： python pytorch

本文链接：https://blog.csdn.net/qq_40601414/article/details/125250412

版权

环境配置

java
yolox训练所用：3060laptop-win，cuda=11.1，torch=1.9（一个小demo跑着玩的，正常建议linux主机端）
serve环境：自行参考官方教程（切记java需配好）

1.1 mar文件准备

mar文件准备主要需要：model类文件和权重文件；或者torchscript保存的模型权重文件。图省事建议第二种，
直接在：path to YOLOX\tools\infer.py
中找张图infer一下，找到模型推理前一刻，如下代码块第三行前插入上两行

script_model=torch.jit.trace(self.model, img,strict=False)
torch.jit.save(script_model, r'E:\vsCodes\detection_tools\detModels\YOLOX\tools\0612.pt')
outputs = self.model(img)

得到了0612.pt文件（这么弄不需要再把model类拉出来）

1.2 handler文件编写

handler文件继承自serve提供的basehandler；
主要写如下三个模块：

def preprocess(self, data):
	'''
	接口走post请求；
	所以这一步将二进制流转为，模型所接受的tensor张量
	'''
def inference(self, data):
	'''
	单纯的一个model infer过程
	'''
def postprocess(self, data):
	'''
	将infer的结果做后处理（nms、设计输出格式），个人习惯如下：
	[{'bbox': [28, 3, 329, 271], 'category': 'label1', 'score': 0.8932}, {'bbox': [375, 49, 167, 144], 'category': 'label2', 'score': 0.7039}]
	'''

两个必要文件准备完毕。导出mar文件。

torch-model-archiver \
--model-name define_name_for_(.mar) \
--version 1.0 \
--serialized-file path/to/file(.pt, torchscript) \
--export-path path/to/(.mar) \
--handler path/to/your_handler.py -f

到此，第一步工作完成。

2.1 模型启服务

这一步很突然，serve封装好了，后续出bug本人目前只能通过打印日志来处理纠错。。。。
可编写.properties文件，绑定ip，局域网内共享，（想要跨网的话，可以去阿里腾讯云那边买个云服务搞一下内网穿透。）

inference_address=http://0.0.0.0:8080
management_address=http://0.0.0.0:8081
metrics_address=http://0.0.0.0:8082
# install_py_dep_per_model=true
#number_of_netty_threads=32
#job_queue_size=1000
#max_request_size=65535000
#max_response_size=65535000

2.2 模型请求

官方有给，比较常用的是两条：

#返回healthy，则环境配置无问题，要处理的无非是之后的handler一些逻辑
curl http:/...:8080/ping

#返回自己设计的ans，则成功
curl http:/...:8080/predicitions/model_name -T path/to/test_img

下面是个python请求的小demo，到这一步，局域网内应该可以通用此api了

import os
import os.path as osp
import cv2
from PIL import Image
from io import BytesIO
import time
import glob
import requests

def test(dirpath):
    list=[]
    # filename = "/home/jzp/codes/local_codes/datasets/0.png"
    # url="http://192.168.1.126:8080/predictions/tmp"
   
    if osp.isdir(dirpath):
    	file_lst=glob.glob(osp.join(dirpath, '*.jpg')
    else:
    	file_lst=[dirpath]
    	
    for filename in os.listdir(file_lst):
        start_t=time.time()
        image = Image.fromarray(cv2.imread(filename))
        image2bytes = BytesIO()
        image.save(image2bytes, format="PNG")
        image2bytes.seek(0)
        image_as_bytes = image2bytes.read()
    
        req = requests.post("http://192.168.1.126:8080/predictions/tmp", data=image_as_bytes)
        if req.status_code == 200:
            res = req.json()
            print(res)
        else:
            print(req)

        # os.system('curl -X POST {} -T {}'.format(url, filename))
        list.append(time.time()-start_t)
    
    # print(list)
    print(len(list))
    print(sum(list))

测了一下，cpu启服务，600张在300s，，，，呃，还是gpu吧。。

3 遇到的问题

一开始是用MMdetection，tools/deploy/mmdet2torchserve.py这个贼方便，但是这样的话handler.py就自然捆绑了mmcv、mmdet，serve的环境需求一下就多了两个，而且单纯cpu环境启服务我搞了玩的话，会遇到些麻烦。再有就是，debug只能疯狂重启服务，读log，handler文件得仔细写。。。

serve: https://github.com/pytorch/serve
yolox: https://github.com/Megvii-BaseDetection/YOLOX
印象较深的一个大哥写的使用（yolov5）：https://blog.csdn.net/qiumokucao/article/details/124856520?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522165501868216781685357478%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=165501868216781685357478&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2_allsobaiduend~default-1-124856520-null-null.142^v13pc_search_result_control_group,157^v14control&utm_term=torchserve+yolov5&spm=1018.2226.3001.4187