OpenCV 4.5.4 刚刚发布!新增SoftNMS、DNN模型8位量化等功能

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

1b64b7d8a8b1a46fbc5906ceeb482371.png

作者丨Penny@知乎

来源丨OpenCV团队

秋季更新OpenCV 4.5.4发布了!

来看看4.5.4都有哪些重要改进:

  • GSoC 2021结束了,11个项目的以下成果目前已经合入OpenCV 4.5.4(main repo和opencv_contrib):

    • DNN模块8位量化功能和导入ONNX量化模型功能

    • 改进的Julia语言绑定

    • 语音识别示例

    • OpenCV DNN对RISC-V的优化(中科院软件所贡献)

    • Universial Intrinsics和parallel_for_使用教程

  • DNN模块

    • 改进layers和activations,支持更多模型

      • GRU, CumSum, Max, Min, ExpandDims

      • 修复卷积的非对称填充

      • 修复Unsqueeze (ONNX opset 13)

      • 修复OpenCL核的几个内存填充问题

    • 实现TextRecognitionModel中的CTC前缀束搜索解码

    • 增加SoftNMS

    • Intel®推理引擎后端(OpenVINO™ ):

      • 增加OpenVINO 2021.4.1 LTS release的支持

      • 增加对非FP32输出或1D输出模型的支持

  • G-API模块

【OpenCV G-API持续改进提升中,对G-API全面了解,欢迎参加10月12日的OpenCV Webinar 9:Understanding OpenCV G-API: Background, Current status, and Future plans

  • 其他贡献

    • objdetect模块中增加基于深度学习的人脸检测libfacedetection和人脸识别(北京邮电大学贡献)

    • 恢复LineSegmentDetector (LSD)实现

    • 增加numpy.ndarray的cv.Mat接口,以处理C++算法中传入3D数组出现的问题

    • 纯Python模块和函数的OpenCV扩展支持

    • cv::Mat增加gdb pretty-printer

    • iOS和macOS增加Quicklook

    • 增加radon checkerboard新类型的生成

    • DNN sample中增加PaddlePaddle人体分割模型支持(百度贡献)

本文仅做学术分享,如有侵权,请联系删文。

3D视觉精品课程推荐:

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

91cb2d2818314e53f25b2c129df53db0.png

▲长按加微信群或投稿

380b085ec792ca3455b1fc3e907d6727.png

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列三维点云系列结构光系列手眼标定相机标定激光/视觉SLAM自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

3a81ed383fc5e1225797fa44394c6a36.png

 圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
可以,OpenCV 4.5.4的DNN模块支持PyTorch的函数可以用来实现这个任务。可以使用DNN模块中的BlobFromImage函数将一维向量转换为适合于输入网络的格式,然后使用forward函数进行前向传播,最后使用np.argmax函数获取最大值的索引。 下面是一个使用OpenCV 4.5.4的DNN模块支持PyTorch的函数来找到一维向量中最大的元素的示例代码: ```python import cv2 import numpy as np # 定义一个只有五个元素的一维向量 v = np.array([1, 3, 5, 2, 4]) # 创建一个网络 net = cv2.dnn.readNetFromTorch("model.pt") # 将一维向量转换为适合于输入网络的格式 blob = cv2.dnn.blobFromImage(v.reshape(1, 1, 1, -1)) # 进行前向传播 net.setInput(blob) out = net.forward() # 使用np.argmax函数获取最大值的索引 max_index = np.argmax(out) print("最大的元素是:", v[max_index]) ``` 在上面的代码中,我们首先定义了一个只有五个元素的一维向量v。然后创建了一个网络,使用readNetFromTorch函数从PyTorch模型文件中读取网络。接下来,使用BlobFromImage函数将一维向量转换为适合于输入网络的格式,并进行前向传播。最后,使用np.argmax函数获取最大值的索引,并使用该索引来获取最大的元素。 需要注意的是,在使用BlobFromImage函数时,我们将一维向量重塑为(1, 1, 1, -1)的形状。这是因为BlobFromImage函数的输入形状是(N, C, H, W),其中N是批次大小,C是通道数,H是高度,W是宽度。在这里,我们使用批次大小为1,通道数为1,高度为1,宽度为向量长度。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值