- 博客(16)
- 收藏
- 关注
原创 显存24G内大模型finetune进阶版实战(Qwen2-7B/internlm2_5-7b-chat/glm-4-9b-chat)
用LLM大模型来finetune处理传统的文本分类任务。分类任务当作生成式任务来做, 有点大炮打蚊子。但还是非常想尝试下,该文记录算法工程师做整个任务的过程。
2024-09-19 19:27:24 372
原创 用目前开源最强的人脸识别模型搭建SOTA人脸识别系统(python+onnx)
人脸识别是cv自从2015年以来最成功的商业应用之一, 人脸识别算法近5年是没有什么发展的,其实也不需要发展了,基本上到天花板了,目前各个公司的主要差距还是在数据上。目前我发现网上大部分的资料还有用facenet?opencv?确实技术太老了,我知道的18年我都不用这些的。
2024-09-11 11:37:51 634
原创 鱼眼全景矫正 Equirectangular Projection的两种方法 【补丁For 双鱼眼全景视频拼接】
我们统一采用opencv remap来加速, 在初始状态建立好remap需要的x坐标对应图和y坐标对应图。只要宽高不变, 每次矫正不耗时。等距投影 by FOV and Angle。等距投影by FOV.方法二将在不久并入到。
2024-08-18 17:28:44 414
原创 2024年图像配准最新算法EfficientLoFTR(cvpr2024) 【补丁For 双鱼眼全景视频拼接】
图像最新SOTA特征点检测与匹配算法
2024-08-18 16:11:59 793 2
原创 yolov8+车辆重识别+transformer
随着transformer在多模态上强有力的对齐能力,以前都很难想象5B组图像-文本pair预训练的参数有多强。现在告诉你,把vit大模型的参数迁移到纯视觉的下游任务,基本上都是指标猛增。veri-776 mAP随随便便上85,以前那么多前辈辛辛苦苦设计的network不如大量数据来的直接。backbone强大才是真强大,装上v12发动机, 奥拓变法拉利。任务目的:使用一张车的照片,在视频or图像中找到这辆出现的时刻。
2024-07-23 16:47:44 1058
原创 yolov8+2024sota_reid+行人重识别+车辆重识别【代码说明】
比如自己的Reid模型(建议把如pth等checkpoint这种模型转换成onnx或者tensorrt, 推理和训练是不一样的,训练时模型会保留梯度等信息且速度不如onnx这种推理架构)使用QT designer打开GUI.ui.home.ui,使用designer去修改,再 pyside6-uic home.ui > home.py。选择图片路径->确认按键->车辆检测-> 目标选择->输入注册标签->确认注册->调用reid提特征->注册的sql中(包括图像/特征/ID)
2024-05-16 10:51:14 1442 3
原创 基于visual transformer的车辆重识别(vehicle reid)系统
A. reid_vehicle_id.onnx 模型是在 VehicleID 数据集上训练的,但由于缺少跨镜头的训练数据,其在具有不同视角的车辆检索任务中表现不佳。通常,其检索阈值在约0.2左右。Note: clip_reid在VeRi-776上的指标上mAP达到84.5,Rank-1达到97.3.(同时该指标并未加re-rank), 其指标在2024年也是非常有竞争力的。B.reid_vehicle_veri.onnx 模型则是在 VeRi-776 数据集上训练的,在我们的 demo 测试中表现最佳。
2024-04-18 22:14:48 1468
原创 2024最强SoTA行人重识别(ReID)项目实战
简单来说,如图所示,对于图像来说,我们的一般流程是先行人检测,将目标行人的位置提取出来,进行裁剪后面送到reid模型中。3.认真阅读这些论文,看看论文的idea与method(是否存在秀技但泛化性弱),拿上图为例,公平的对比是without re-ranking & without extra trainning data. 最后我们选择clip-ReID作为我们的baseline.:几乎所有的ReID方法都需要在ImageNet上训练的初始模型,该数据集包含了手动给定的图像和预定义集合中的一组标签。
2024-04-08 19:56:23 3335 13
原创 【项目END】基于双鱼眼的全景视频图像拼接CV算法实战
在当今科技的飞速发展中,相机技术的创新一直是引领潮流的先锋。而在这股潮流中,双鱼眼相机以其独特的视角和广阔的应用前景引起了广泛关注。本博客将带领大家深入探讨双鱼眼相机拼接技术,解锁一种全新的视觉体验。视觉全景:双鱼眼相机能够捕捉到超广角的视野,使得拍摄的画面更加丰富、更具冲击力。同时双鱼眼只需要两个相机就能捕捉全景图像是成本最低的全景取景器。应用广泛:从虚拟现实到安防监控,从全景摄影到机器视觉,双鱼眼相机的应用场景越来越广泛。
2023-12-13 16:30:59 3154 5
原创 【算法】双鱼眼图像and视频拼接细节说明
大家都知道VR,能够看到360度全景图像,即每帧图像记录了360度的景色。而工业界是怎样拍摄这样的图像的呢?
2023-10-18 15:33:51 7452 1
原创 【idea】有意思的应用idea之全景图的目标检测
全景图目标检测是针对360度广视角的图像来进行目标检测。相对于传统的目标检测, 全景图目标检测有着以下优势:1.能够捕捉到更广泛的场景,允许检测目标在大范围内的分布和移动。如在安防领域,避免监控死角。2.可以用于更深入的场景分析和理解,因为它提供了更多的上下文信息,有助于分析目标与周围环境的关系。总之,全景图目标检测有助于应对更复杂的场景,提供更多的信息来改善目标检测和分析任务。它对于监控、搜索与救援、自动驾驶等领域有重要应用,特别是在需要全局上下文信息的场景中,它的优势更加明显。
2023-10-17 17:36:59 434
原创 【环境】python基础环境隔离搭建
在命令行打conda执行, 如果有错一般就一种情况:可执行文件未全局可见。Anaconda 简单来说就是一个方便的包管理器,使用户能够轻松地安装、管理和更新这些工具和库。这个是官网: https://repo.anaconda.com/archive/
2023-09-16 17:03:44 515
原创 【算法】双鱼眼拼接制作360度VR取景器/dual fisheye to equirectangular
第二步: 绝大多数情况下,overlap区间的图像不是完全对齐的, 如果使用阈值将两张图的overlap直接叠加,会使得拼接处有重影。在这里我们假设两张图像的边缘位置存在overlap, 然后我们需要在overlap中找到两张图的对齐变换关系,使得他们在overlap区间图像能够完全重合。第二步:我们采用球面透射投影, 我们首先定义了球面上的点的极坐标,然后计算了这些点的笛卡尔坐并使用球面透射投影的数学公式计算了投影点的坐标。目的: 将上面的两个图像合并成一个无缝的整体的过程。2.1 算法模块拆解。
2023-09-08 17:36:09 1522 10
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人