量船-CSDN博客

原创使用 ONNXRuntime 推理 YOLOv11 模型

通过onnxruntime框架来推理yolov11，使用cv2和numpy来完成预处理和后处理环节。本文介绍了如何使用 ONNXRuntime 推理 YOLOv11 模型，并实现了目标检测的完整流程。通过合理的后处理（如 NMS），可以有效过滤冗余框，提升检测效果。希望本文对您有所帮助！

2025-01-26 11:26:35 1274 2

原创 go实现敏感词识别，100w条句子，只要1秒

基于 Aho-Corasick 算法的敏感词检测，通过http接口让其他人调用。

2024-11-15 15:06:38 448 1

原创 linux上使用fastllm部署qwen1.8b,2G显存可跑

python，用于转换模型权重，fastllm也提供了python的api，我的是python3.10.13。转完之后在build目录生成一个model.flm文件，大概1.9G大小。到fastllm目录，修改下main.cpp文件，加一个计时。这三个路径修改为自己的模型储存目录，下面修改一下，方便加载。下载qwen1.8b权重，国内推荐使用魔塔社区开源库，安装。编译完成后，可以使用如下命令安装简单的python工具包。下载，cache_dir修改为自己的路径。模型路径传对，参数传对，基本不会有问题。

2024-01-29 14:19:05 1365

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_49651327的博客

原创使用 ONNXRuntime 推理 YOLOv11 模型

原创 go实现敏感词识别，100w条句子，只要1秒

原创 linux上使用fastllm部署qwen1.8b,2G显存可跑

原创 cpu通过http接口部署qwen1.8b

原创 flask+gunicorn多线程部署yolov5

原创 yolov5 6.1 flask返回检测图片

空空如也

空空如也

原创 使用 ONNXRuntime 推理 YOLOv11 模型

原创 go实现敏感词识别，100w条句子，只要1秒

原创 linux上使用fastllm部署qwen1.8b,2G显存可跑

原创 cpu通过http接口部署qwen1.8b

原创 flask+gunicorn多线程部署yolov5

原创 yolov5 6.1 flask返回检测图片

空空如也

空空如也

原创使用 ONNXRuntime 推理 YOLOv11 模型