- 博客(3730)
- 资源 (2)
- 收藏
- 关注
转载 ICCV 2023 | RPL:自动驾驶中道路异常检测的新思路
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达本文只做学术分享,如有侵权,联系删文Residual Pattern Learning: 在不影响模型闭集表现的情况下分割异常物体Out-of-Distribution (OoD) Segmentation 是在原有的闭集分割器的基础上, 让模型进一步拥有识别异常物体的能力。现在的SOTA的方法都是基于重新fine-tuning...
2023-12-04 10:05:26
10
转载 YOLOv5网络结构训练策略详解
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达这一篇讲解一下yolov5模型结构,数据增强,以及训练策略。官方地址:https://github.com/ultralytics/yolov5yolov5模型训练流程:https://blog.csdn.net/qq_45066628/article/details/129470290?spm=1001.2014.3001.5...
2023-12-03 10:05:46
13
转载 OpenCV之图像处理基础
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达这篇文章介绍图像的基本表示方法、像素的访问和操作、感兴趣区域处理、通道处理等知识点。需要说明的是,在使用面向python的OpenCV必须熟练掌握Numpy库,尤其是Numpy.array库是python处理图像的基础。图像的基本表示方法这里只讨论二值图像、灰度图像、彩色图像的基本表示方法。二值图像二值图像是指仅仅包含黑色和白色...
2023-12-03 10:05:46
16
转载 python抠图(去水印)开源库lama-cleaner
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达1. 关于 Lama CleanerLama Cleaner 是由 SOTA AI 模型提供支持的免费开源图像修复工具。可以从图片中移除任何不需要的物体、缺陷和人,或者擦除并替换(powered by stable diffusion)图片上的任何东西。特征:完全免费开源,完全自托管,支持CPU & GPU & ...
2023-12-03 10:05:46
17
转载 非常适合自学人工智能大模型的10个公众号号
深度学习大模型是指由数百万、甚至数十亿个参数组成的神经网络模型,可以处理大规模的数据集,并且具有非常强的学习能力和泛化能力。大模型的优势包括更强的学习能力、更好的泛化能力以及更高效的计算能力。这些模型可以应用于各种领域,今天给大家推荐10个原创公众号,这些公众号定期会发些高质量原创,希望可以让你更高效的了解和学习。数据STUDIO????☠️宝藏级????☠️ 原创公众号 『数据STUDIO』,内容超级硬...
2023-12-03 10:05:46
9
转载 复旦大学|AIGC图像检测方法的综合测评平台
(本图由AIGC大模型合成)随着AIGC技术的发展,由AI所生成的虚假图像的检测正成为一个新的研究热点。然而,现有检测方法的实验条件与测试数据集不完全相同,无法直接横向对比检测性能。为此,复旦大学计算机学院多媒体智能安全实验室针对现有主流AIGC图像检测方案进行全面分析与比较,并提出了性能更好的AIGC图像检测新方法。更进一步,课题组提供了一个综合测试与评估平台,在保证相同训练集与实验条件的情况下...
2023-12-02 10:06:02
15
转载 OpenCV常用的 7 个示例:从读取到人脸检测
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达OpenCVOpenCV是计算机视觉领域最流行的库之一。它最初是用 C 和 C++ 编写的。现在也可以在 Python 中使用。它最初是由英特尔开发的。该库是一个跨平台的开源库。免费使用。OpenCV 库是一个高度优化的库,其主要重点是实时应用程序。OpenCV 库是2500多个优化算法的组合。它可以用来检测和识别不同的人脸,在...
2023-12-02 10:06:02
12
转载 YOLO新模型:助力智慧农业,一种改进的基于注意力机制和特征融合的茶叶病害检测模型...
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达Column of Computer Vision Institute基于AI技术帮助中国农业快速发展,智慧农业也是最近几年的热门话题。01前景概要在茶树生长过程中,茶树病害对茶叶产量和品质有着重要影响。茶叶病害的形态和规模各不相同,病害靶标通常较小,茶叶病害的智能检测过程也容易受到生长区域复杂背景的干扰。此外,一些茶叶病害集中...
2023-12-02 10:06:02
13
转载 深度学习如何训练出好的模型
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达向AI转型的程序员都关注了这个号????????????深度学习在近年来得到了广泛的应用,从图像识别、语音识别到自然语言处理等领域都有了卓越的表现。但是,要训练出一个高效准确的深度学习模型并不容易。不仅需要有高质量的数据、合适的模型和足够的计算资源,还需要根据任务和数据的特点进行合理的超参数调整、数据增强和模型微调。在本文中,我们将会详细介绍深度...
2023-12-01 10:05:52
18
转载 ICCV 2023 | 旷视研究院入选论文亮点解读,涵盖3D目标检测、图像匹配、光流、点云配准等...
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达本文转自旷视研究院,作者R。近日,国际计算机视觉大会 ICCV(International Conference on Computer Vision)公布了 2023 年论文录用结果,本届会议共有 8068 篇投稿,接收率为26.8%。ICCV 是全球计算机领域顶级的学术会议,每两年召开一次,ICCV 2023 将于今年10月...
2023-11-30 10:05:16
44
转载 Kalman滤波通俗理解和实际应用
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达01Kalman用于解决什么的问题卡尔曼滤波是一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。由于观测数据中包括系统中的噪声和干扰的影响,所以最优估计也可看作是滤波过程。人话就是:线性数学模型算出预测值+传感测量值=更准确的测量值。02先来看一下姿态估计问题03看几个例子(1)例题1(2)例题2...
2023-11-30 10:05:16
26
转载 IMU校准,到底校准什么?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者:龙猫 来源:https://www.zhihu.com/question/532035742/answer/3087044029编辑:计算机视觉工坊简介最近在学习传感器相关的知识,在国外的一篇论文学习过程中,觉得这篇论文的校准方法是个不错的参考。这种校准简单且比较鲁棒的算法,操作简单,且除了偏移与比例系数,还可以估计出传...
2023-11-30 10:05:16
28
转载 那些年我们一起卷过的卷积
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达编者荐语本篇文章将回顾那些年的一些经典卷积神经网络,并提炼要点且从网络结构、工作亮点、核心实现代码方面来进行阐述。作者丨鲲China@知乎链接丨https://zhuanlan.zhihu.com/p/576100800引言卷积是图像神经网络中的重要组成部分,它担起提取特征的重任,每当你编写一个网络结构的时候,它总会大喊"我来...
2023-11-29 19:39:34
15
转载 强烈推荐一个Python可视化模块,简单又好用
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达数据可视化动画还在用Excel做?现在一个简单的Python包就能分分钟搞定!而且生成的动画也足够丝滑,效果是酱紫的:这是一位专攻Python语言的程序员开发的安装包,名叫Pynimate。目前可以直接通过PyPI安装使用。使用指南想要使用Pynimate,直接import一下就行。importpynimateasnim...
2023-11-29 19:39:34
16
原创 AMFNet: 用于道路和负障碍物分割的自适应掩码融合网络
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达导读今天带来的解读文章是《Adaptive-Mask Fusion Network for Segmentation of Drivable Road and Negative Obstacle With Untrustworthy Features》作者:Zhen Feng,Yuchao Feng,Yanning Guo,Yu...
2023-11-28 10:05:50
19
转载 如何测算出任一副图片中的物体的实际尺寸?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达比如我想知道这个书架每一格的高宽,有办法吗?没有什么神奇的软件可以帮忙?A:从一幅图像中无法测出物体的长度,因为缺乏参照物,但可以测出两个平行物体的长度比例。如果已知一个物体的实际大小(比如在图片中放上一枚1元硬币或者知道某个柜子有多高),那么就可以通过长度比和参照物的已知长度测出物体长度。具体方法见文献[1],因为需要一些矩阵...
2023-11-28 10:05:50
31
转载 模型部署系列 | 卷积Backbone量化技巧集锦
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达前言深度神经网络在广泛的任务中被证明是有效的。然而,它们高昂的计算和内存成本使得在资源受限的设备上部署它们不切实际。为了解决这个问题,已经提出了量化方案来减少内存占用并提高推理速度。虽然已经提出了许多量化方法,但它们缺乏对其有效性的系统分析。为了弥补这一空白,作者收集并改进现有的量化方法,并提出了PTQ量化的黄金准则。作者在I...
2023-11-28 10:05:50
20
转载 Python 图像合并:利用 OpenCV 的强大功能
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达图像合并,也称为图像合成或混合,使我们能够通过无缝合并多个图像来创建视觉上引人注目的合成图像。Python 以其简单性和广泛的库生态系统而闻名,为实现图像合并技术提供了理想的平台。借助 OpenCV 的高级图像处理、混合和蒙版功能,我们可以实现令人惊叹的艺术效果。在本教程中,我将指导你完成从设置开发环境到理解关键概念和技术的每个...
2023-11-27 07:31:04
16
转载 pytorch怎么使用c++调用部署模型?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨Civ@知乎(已授权)来源丨https://www.zhihu.com/question/66532235/answer/2782357337编辑丨极市平台极市导读本文以C++推理框架ncnn为例,介绍一下部署的大致流程。其它C++推理框架的思路类似,唯一的学习成本是推理框架本身的API方法有很多种,比较简单的路径是:...
2023-11-27 07:31:04
17
转载 scikit-learn机器学习模型构建模板!
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达本文介绍scikit-learn机器学习模型构建模板!算法工程师是伴随着人工智能火起来的一个领域。听着名字似乎门槛很高。但是,得益于Python生态下的包共享机制,机器学习模型构建的过程其实已经变得非常简单了,很多听起来牛逼的算法,其实根本不需要自己实现,甚至都不需要知道这些算法的具体原理。你只需要两步就能构建起自己的机器学习模...
2023-11-27 07:31:04
17
转载 如何在自定义数据集上训练 YOLOv8 实例分割模型
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达在本文中,我们将介绍微调 YOLOv8-seg 预训练模型的过程,以提高其在特定目标类别上的准确性。Ikomia API简化了计算机视觉工作流的开发过程,允许轻松尝试不同的参数以达到最佳结果。使用 Ikomia API 入门通过 Ikomia API,我们只需几行代码就可以训练自定义的 YOLOv8 实例分割模型。要开始,请在虚...
2023-11-27 07:31:04
73
转载 Transformer时间序列预测!
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达【导读】大家好,我是泳鱼。一个乐于探索和分享AI知识的码农!今天带来的这篇文章,提出了一种基于Transformer的用于长期时间序列预测的新方法PatchTST,取得了非常显著的效果。希望这篇文章能对你有所帮助,让你在学习和应用AI技术的道路上更进一步!自从时间序列预测论文Are Transformers Effective...
2023-11-27 07:31:04
28
转载 Yolov5移植树莓派实现目标检测
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达一、任务描述通过机器视觉的方式实现对工件的识别,以树莓派作为上位机,根据不同的识别效果对下位机发出不同指令,控制整个机器的运转,流程如下:二、数据集获取这是老师发的零件,所以网上肯定没有直接能用的模型,不像口罩检测等有现成的数据集,所以我们需要自己去获取数据集。由于我们的零件只有两个,如果我们想获取大量图片话,我们可以通过旋转...
2023-11-26 10:05:26
20
转载 ICCV23|DenseDiffusion:无需训练显著改进文本到图像生成匹配度!
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨岳廷编辑丨极市平台本文首发于极市平台,转载须经授权并注明来源插入公众号名片。极市导读不需要额外数据集进行微调就可以改善模型对文本和布局条件的遵循程度。paper:https://arxiv.org/pdf/2308.12964v1.pdfcode:https://github.com/naver-ai/DenseDif...
2023-11-26 10:05:26
24
转载 python实现简单的车道线检测
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨绿竹巷人来源丨古月居python实现简单的车道线检测,本文章将介绍两种简单的方法1.颜色阈值+区域掩模2.canny边缘检测+霍夫变换这两种方法都能实现简单的车道线检测demo,注意仅仅是demo下面的图片是用到的测试图片1.颜色阈值+ 区域掩模我们可以仅仅通过设置一些RGB通道阈值,来提取车道线。以下的代码设置了RGB通...
2023-11-26 10:05:26
21
转载 综述:分割一切模型(SAM)的全面调研
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达来源丨机器之心编辑丨极市平台极市导读作为首个全面介绍基于 SAM 基础模型进展的研究,本文聚焦于 SAM 在各种任务和数据类型上的应用,并讨论了其历史发展、近期进展,以及对广泛应用的深远影响。人工智能(AI)正在向 AGI 方向发展,这是指人工智能系统能够执行广泛的任务,并可以表现出类似于人类的智能水平,狭义上的 AI 就与...
2023-11-25 11:12:31
33
转载 CNN和Transformer结合解锁
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达由于复杂的注意力机制和模型设计,大多数现有的视觉 Transformer(ViT)在现实的工业部署场景中不能像卷积神经网络(CNN)那样高效地执行。这就带来了一个问题:视觉神经网络能否像 CNN 一样快速推断并像 ViT 一样强大?近期一些工作试图设计 CNN-Transformer 混合架构来解决这个问题,但这些工作的整体性能...
2023-11-25 11:12:31
25
转载 ICCV 2023 | StreamPETR:纯视觉感知与激光雷达终有一战之力!
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达论文作者| Shihao Wang编辑 | 自动驾驶之心文章链接:https://arxiv.org/abs/2303.11926代码链接:https://github.com/exiawsh/StreamPETR纯视觉BEV感知虽然发展了两年左右的时间,但距离激光雷达算法一直都有较大差距。BEVDepth首次将纯视觉与激光雷...
2023-11-25 11:12:31
25
转载 在自动驾驶领域,如何实现激光雷达和相机的时间同步呢?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达刚好最近在研究车上多传感器时间同步的问题,车上一般传感器包括:camera,Radar, Lidar, gnss,rtk,组合导航,轮速计等等。那么常见的传感器间时间同步主要涉及到camera, radar, lidar, imu等。对于如何实现传感器的时间同步,以及时间同步一般包括哪些内容,可能需要从以下几个方面考虑:1)统一...
2023-11-24 09:30:57
39
转载 一拖一拽,玫瑰复活了!谷歌提出生成图像动力学,从此万物皆有灵
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨桃子 润来源丨新智元编辑丨极市平台极市导读图中万物皆能动!谷歌团队最新提出的「生成图像动力学」,能将静态图片转化为动态的、无缝循环的视频,甚至还可以交互。快看,轻轻一拉,玫瑰动就起来了。拖着叶子往左一拉,这颗松柏向同样的方向移动。还有世界各种物体的图片,随手一拉,瞬间活灵活现。这便是谷歌团队最新研究,让你的手变成「魔法金...
2023-11-24 09:30:57
19
转载 语义分割方向开源数据集资源汇总
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达编辑丨极市平台极市导读本文收集和整理了一些语义分割相关的开源数据集,附下载链接,希望能给大家的学习带来帮助。高分二号 (GF-2) 卫星图像大型土地覆盖数据集数据集下载地址:http://suo.nz/2dPkdvGID 是具有高分二号 (GF-2) 卫星图像的大型土地覆盖数据集。这个新的数据集被命名为高分影像数据集(GID...
2023-11-24 09:30:57
16
转载 用深度学习的方式融合各种信息
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者:Purvanshi Mehta,编译ronghuaiyang用深度学习的方式融合各种信息简介导读使用深度学习融合各种形式的信息。多模态数据我们对世界的体验是多模态的 —— 我们看到物体,听到声音,感觉到质地,闻到气味,尝到味道。模态是指某件事发生或经历的方式,当一个研究问题包含多个模态时,它就具有多模态的特征。为了让人工智...
2023-11-24 09:30:57
16
转载 系统回顾深度强化学习预训练
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达本文中,来自上海交通大学和腾讯的研究者系统地回顾了现有深度强化学习预训练研究,并提供了这些方法的分类,同时对每个子领域进行了探讨。近年来,强化学习 (RL) 在深度学习的带动下发展迅速,从游戏到机器人领域的各种突破,激发了人们对设计复杂、大规模 RL 算法和系统的兴趣。然而,现有 RL 研究普遍让智能体在面对新的任务时只能从零开...
2023-11-23 10:05:39
16
转载 双目视觉之相机标定
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达来源:芯视tof ,3d tof目录一、三大坐标系1、图像坐标系到像素坐标系2、世界坐标系到摄像机坐标系3、摄像机坐标系到图像坐标系4、总结二、图片矫正三、张氏标定法四、使用opencv实现单目标定去年三四月份实验室做了一个机器人与视觉识别系统的项目,主要就是利用双目摄像头进行物体空间坐标定位,然后利用机器人进行抓取物体。当时...
2023-11-23 10:05:39
33
转载 3步!顶会作者讲解复现CVPR Best Paper!
如果说做科研有什么必备技能,那么读论文一定是不可或缺的。一个专业的研究员一年需要花上百小时在论文的阅读复现上,所以阅读的技巧很重要。然而,最大的BUG是,很多科研er不是专业研究员,根本不知道该如何阅读并复现论文,更别说阅读复现的技巧了。。。为了科研初学者扫清读论文的障碍,我们特意邀请到CVPR顶会论文的作者,给大家带来人工智能-CV方向论文带读。扫码免费参与paper带读课程赠导师亲自整理100...
2023-11-22 10:14:48
30
转载 深度学习有哪些trick?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达前言Deep learning在训练的时候往往有很多trick,不可否认这些trick也是DL成功的关键因素之一,所谓“the devil is in the details”。除了batch大小的改变以及初始化等trick,还有哪些提升performance的利器?编辑 | 极市平台 整理自丨知乎链接丨https://www...
2023-11-22 10:14:48
25
转载 YOLO落地部署 | 让YOLO5和YOLO7等方法都可以用上4-bit/3-bit的超快部署方案
点击下方卡片,关注「集智书童」公众号点击加入????「集智书童」交流群量化网络使用较少的计算和内存资源,适用于部署在边缘设备上。而量化感知的训练(GAT)是一种广泛研究的将网络在低精度下进行量化的方法,但大多数研究聚焦于过参数化的网络分类,对于流行的边缘设备友好的单次目标检测和语义分割方法(如YOLO)的研究还比较有限。此外,大多数QAT方法依赖于直方估计(HE)近似,该方法受到振荡现象的影响,导致网络...
2023-11-21 09:12:45
29
转载 美国老姐看完200+中国学生SCI论文,怒写超详细“中国人英文论文写作指南”,还被推上了B站热门…...
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达来源丨量子位编辑丨极市平台极市导读各位本科僧/研究僧/博士僧,你的SCI论文翻译好了吗?又到了一年一度论文生长(Deadline)的季节。各位本科僧/研究僧/博士僧,你的SCI论文翻译好了吗?投稿之前,总少不得再给文章润色一番,可作为非母语写作者,语法、惯用语的坑多少是有点防不胜防。花钱请人编辑,价格昂贵不说,对方又常常存在不...
2023-11-21 09:12:45
35
转载 前向-前向神经网络训练算法
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达在 NeurIPS 2022 会议的一场特邀演讲中,图灵奖得主、深度学习先驱 Hinton 在关于深度学习影响计算机构建方式、神经网络算法等方面分享了他的最新观点。NeurIPS 2022 会议正在如火如荼地进行之中,各路专家学者围绕着深度学习、计算机视觉、大规模机器学习、学习理论、优化、稀疏理论等众多细分领域展开交流与探讨。会...
2023-11-21 09:12:45
20
转载 如何评价3D点云的前景?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达本文只做学术分享,如有侵权,联系删文本人从通信转行转业至计算机相关行业,目前准备读博,方向是3D 点云数据压缩。致力于开发一种更高效的图像、视频压缩算法。然而因转行转业不久,在图像、视频处理,数据压缩相关领域基础知识比较薄弱,在此希望得到各位大神的指导包括以下几个方面:1.此领域内有哪些必读的书(我自己想到的:拓扑几何、图像压缩...
2023-11-21 09:12:45
99
Python视觉实战项目31讲.pdf
2020-10-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人