自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4072)
  • 资源 (2)
  • 收藏
  • 关注

转载 一位上海交大教授的深度学习七年研究总结

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者注记我是2017年11月开始接触深度学习,至今刚好七年。2019年10月入职上海交大,至今三年,刚好第一阶段考核。2022年8月19号,我在第一届中国机器学习与科学应用大会做大会报告,总结这五年的研究以及展望未来的方向。本文是该报告里关于理论方面的研究总结(做了一点扩展)。报告视频链接可以见:https://www.bili...

2024-04-25 14:21:05 10

转载 无痛涨点:目标检测优化的实用Trick

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达前言本文介绍了在图像预处理调参、模型训练调参等方面中的技巧,并提醒读者要多注意数据的分布和呈现的状态。对卷积网络来说,所学习的就是数据集的数据分布,你的卷积核参数最后形成的也是对数据集中特征分布的认知。写这篇文章就是因为up主的邀请,然后分享一下自己工作时候总结的一些经验和技巧,不一定适用别的网络,有的还可能会有反作用,所以也...

2024-04-25 14:21:05 11

转载 时序多方向论文204篇大整理,包含时序预测/时序Transformer/时序大模型等最新研究...

时空预测引领了新的热点,时间序列预测领域的首个大模型 TimeGPT 引起业界热议,Transformer+时序,扩散模型+时序更是顶会新方向大热“种子”选手,时序+多方向正在成为这个AI界瞩目的黑马!本文整理了时间序列的时序预测 / 时序-Transformer / 时序-大模型 / 时序-扩散四大方向的最新论文204篇。扫码回复“时序”领论文新idea预约25日晚20:00时序最新热点解读直播...

2024-04-24 10:05:14 19

转载 深度学习水果识别系统-python

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达传统图像识别原理传统的水果图像识别系统的一般过程如下图所示,主要工作集中在图像预处理和特征提取阶段在大多数的识别任务中, 实验所用图像往往是在严格限定的环境中采集的, 消除了外界环境对图像的影响。但是实际环境中图像易受到光照变化、 水果反光、 遮挡等因素的影响, 这在不同程度上影响着水果图像的识别准确率。在传统的水果图像识别系统...

2024-04-24 10:05:14 15

转载 硕博表示震惊!小学生科创比赛获奖作品被指 “ 已达硕博水平 ” !

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达来源 |慕格学术青少年科技创新大赛又现新质疑,获得一等奖的小学生作品被指“已达硕博水平”。随后,上海市科学技术协会回应,已有专人跟进核实。日前,第39届上海市青少年科技创新大赛获奖名单公示后,个别获奖作品受到质疑。例如,一获奖作品涉及“蒙特卡洛算法”,被指过于高深。  该赛事部分获奖作品名单据悉,上海市青少年科技创新大赛创...

2024-04-23 10:05:37 21

转载 深度学习面试必备的 25 个问题

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者 | Tomer Amit译者 | 弯月,责编 | 屠敏出品 | CSDN(ID:CSDNnews)以下为译文:在本文中,我将分享有关深度学习的25个问题,希望能够帮助你为面试做好准备。1.为什么必须在神经网络中引入非线性?答:否则,我们将获得一个由多个线性函数组成的线性函数,那么就成了线性模型。线性模型的参数数量非常少,因...

2024-04-23 10:05:37 9

转载 深度学习训练过程可视化工具

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达仅作学术分享,不代表本公众号立场,侵权联系删除转载于:极市平台、机器学习实验室,AI有道本文介绍了多个能将深度学习训练过程进行可视化的工具,帮助大家更好地理解深度学习,非常实用。深度学习训练过程一直处于黑匣子状态,有很多同学问我具体怎么解释?其实很多还是无法可解释,但是通过可视化,具体可以知道深度学习在训练过程到底学习了哪些特征...

2024-04-23 10:05:37 83

转载 软件ISP将成为图像处理未来?

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达从电子门铃、网络摄像头,到手机、电脑、汽车,图像传感器已遍布我们生活中的各个角落,高清晰度、精细化的图像已经成为了消费者的基本期望。在这些边缘设备中,摄像头收集到的图像需要先由图像信号处理器 (ISP)实时处理后再呈现给用户。然而,如何在高效处理海量数据的同时又确保图像质量,对芯片制造商来说既是一个挑战,也是一个机会。一般来说,...

2024-04-22 11:50:47 13

转载 中国永远不会倒闭的四个行业

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达来源:硅谷智库据教育部公布的数据,2024届高校毕业生人数预计将达到1187万人,较2023年增加29万,再创历史新高。同时,受全球经济形势的影响,一些行业和领域的就业形势并不乐观,比如房地产、传统零售业、传统金融业、低技能服务行业等。而有些行业,不管时代如何变迁,它们都稳定得如同定海神针。对毕业生和求职者而言,选择至关重要,它...

2024-04-22 11:50:47 14

转载 如何解决混合精度训练大模型的局限性问题?

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨Ben Snyder来源丨DeepHub IMBA编辑丨极市平台极市导读本文主要讨论关于混合精确训练的数值稳定性问题,作者列举了一些解决方案以及数值不稳定性的补救措施。混合精度已经成为训练大型深度学习模型的必要条件,但也带来了许多挑战。将模型参数和梯度转换为较低精度数据类型(如FP16)可以加快训练速度,但也会带来数值稳...

2024-04-22 11:50:47 11

转载 如何使用 Python比较两张图像并获得准确度?

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达本文,将带你了解如何使用 Python、OpenCV 和人脸识别模块比较两张图像并获得这些图像之间的准确度水平。首先,你需要了解我们是如何比较两个图像的。我们正在使用Face Recognition python 模块来获取两张图像的128 个面部编码,我们将比较这些编码。比较结果返回 True 或 False。如果结果为Tru...

2024-04-21 10:05:32 18

原创 使用 OpenCV 测量物体尺寸

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达你是否曾经遇到过这样的问题:想要知道计算器的精确尺寸,但手头又没有专业的测量工具?别担心,今天我们就来教大家一个简单又实用的方法,通过一张A4纸就能估算出计算器的宽度和高度,精确到毫米哦!该算法的主要思想其实非常简单。请看下面图 1 中我们要处理的样本图像。图 1.本教程中使用的示例图像。本教程的目的是估算计算器的宽度和高度(以...

2024-04-21 10:05:32 323 1

转载 全新 SOTA backbone | 2024年了,再见ViT系列Backbone,实数难得,不知道效果如何?...

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达在构建用于精确匹配的深度固定长度表示时,确定指纹上的密集特征点,特别是在像素 Level 上,具有重大意义。为了探索指纹匹配的可解释性,作者提出了一种多阶段可解释的指纹匹配网络,名为通过视觉 Transformer 进行指纹匹配的可解释固定长度表示(IFViT),该网络由两个主要模块组成。第一个模块是一个可解释的密集配准模块,它...

2024-04-20 10:06:08 18

转载 视觉Transformer中ReLU替代softmax

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达仅作学术分享,不代表本公众号立场,侵权联系删除转载于:机器之心Transformer 架构已经在现代机器学习领域得到了广泛的应用。注意力是 transformer 的一大核心组件,其中包含了一个 softmax,作用是产生 token 的一个概率分布。softmax 有较高的成本,因为其会执行指数计算和对序列长度求和,这会使得并...

2024-04-20 10:06:08 24

转载 算法工程师的核心竞争力是什么?

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达链接:https://www.zhihu.com/question/527696166编辑:深度学习与计算机视觉声明:仅做学术分享,侵删作者:赵俊博 Jakehttps://www.zhihu.com/question/527696166/answer/25498389241.工程的整体性思考能力和打仗经验2.对于某一个业务的独...

2024-04-20 10:06:08 25

转载 实际工程项目中是怎么用卡尔曼滤波的?

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达编辑|汽车人原文链接:https://www.zhihu.com/question/358334095回答一 作者:李崇链接:https://www.zhihu.com/question/358334095/answer/1160183841两大难题,一是运动学模型的建立,也就是预测方程。这个一方面可以通过比较细的系统辨识来...

2024-04-19 10:20:55 22

转载 使用Python的一维卷积

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达经常看到有人想学习如何快速开发深度学习应用程序,他们学习了PyTorch或Tensorflow等库的基础知识,但他们还没有真正理解他们使用的这些神奇功能背后的含义。这种情况经常发生,当某些功能不起作用或需要自定义某些功能时,没有人知道从哪里开始。当一个人对计算机视觉感兴趣时,通常会开始研究卷积神经网络,从高层次来说,它们是非常容...

2024-04-19 10:20:55 21

转载 使用 Python 和 OpenCV 制作反应游戏

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达在本文中,将向你展示如何使用 OpenCV 在 Python 中制作一个反应游戏,你可以动手来玩。你可能已经熟悉 OpenCV,OpenCV 基本上允许进行各种图像处理。你可以在下面的视频中看到最终结果,并且可以在此处获取文件:https://github.com/Goncalo-Chambel/ReactionGame尽管这可...

2024-04-19 10:20:55 22

转载 炸裂!最新CVPR2024、ACL2024、AAAI2024、ICML2023论文+Code大合集!

我花了3个月的时间整理了包括CVPR 2023/2024、ECCV 2023、ICML 2023、ICLR 2024/2023、NeurIPS 2023、ACL 2024、EMNLP 2023、AAAI 2024/2023、WWW 2023/2024等顶会在内的超过20000篇人工智能优质论文,今天一次性分享给大家。为了方便大家阅读,我把各大顶会的论文整理打包,按会议合集、细分方向合集整理如下:0...

2024-04-19 10:20:55 41

转载 实战 | 基于YOLOv9+SAM实现动态目标检测和分割(步骤 + 代码)

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达导 读 本文主要介绍基于YOLOv9+SAM实现动态目标检测和分割,并给出详细步骤和代码。背景介绍在本文中,我们使用YOLOv9+SAM在RF100 Construction-Safety-2 数据集上实现自定义对象检测模型。这种集成不仅提高了在不同图像中检测和分割对象的准确性和粒度,而且还扩大了应用范围...

2024-04-18 10:05:57 118

转载 实践教程 | 在yolov5上验证一些不成熟的想法

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨王小二@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/388246083编辑丨极市平台极市导读本文做了两件事:一是把基于mxnet的训练代码迁移到pytorch上,二是在yolov5的代码基础上验证了一些关于目标检测的想法,也希望有感兴趣的互相探讨一下。一、起因在迁移mxnet训练代码的...

2024-04-18 10:05:57 26

转载 神经网络调参指南

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达Author:夕小瑶From:夕小瑶的卖萌屋序言虽然现在仅仅靠调参已经在深度学习领域不是香饽饽了,但是如果连参数都不会调,那可能连肉汤都喝不到的。毕竟你有再好的idea,也需要有一个漂亮的实验结果去支撑的对不对,参数调不好,千里马也容易被当成骡子。说到调参,也不得不吐槽现在行业里论文复现难的问题。小夕曾经非常好奇AAAI2018...

2024-04-18 10:05:57 24

转载 深度学习多目标优化的多个loss应该如何权衡

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨马东什么@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/362330594编辑丨极市平台极市导读本文介绍了一篇关于多任务学习的综述,详细介绍了文章中关于多任务学习的两个主要研究方向:task balancing和其他。看了那么多篇理论慢慢的paper,终于找到一篇比较有工程意义的paper...

2024-04-18 10:05:57 23

转载 如何通俗理解协方差、相关系数?

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达Part1 方差之前介绍了方差是用来刻画数据波动性的统计量,那么协方差就是描述两个变量之间的变动关系。通俗地理解为:两个变量是同向变化?还是反向变化?同向或反向程度有多少?X变大,Y也变大,说明两个变量是同向变化的,这时协方差就是正的。X变大,Y变小,说明两个变量是反向变化的,这时协方差就是负的。并且从数值大小来看,协方差的绝对...

2024-04-17 10:04:53 38

转载 收藏 | 论文画图工具:25个常用Matplotlib图的Python代码总结

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达仅作学术分享,不代表本公众号立场,侵权联系删除转载于:作者丨zsx_yiyiyi来源丨python大本营编辑丨极市平台#!pipinstallbrewer2mplimportnumpyasnpimportpandasaspdimportmatplotlibasmplimportmatplotli...

2024-04-17 10:04:53 29

转载 5个步骤得到高质量顶会idea,牛!

一个高质量的创新点通常具备以下特点:原创性: 好的创新点应该是新颖的,能够提供与众不同的视角或解决方案,而不是简单重复已有的研究。重要性: 创新点应当针对领域内的重要问题或挑战,其研究成果能够对学术界或实际应用产生显著影响。可行性: 一个实用的创新点应当是可实施的,能够在有限的时间和资源内得到验证和实现。清晰性: 好的创新点应当表述清晰,易于理解和交流,能够让同行和读者快速把握其核心思想。扩展性:...

2024-04-17 10:04:53 21

转载 终于看到一个不在 Backbone上研究 ResNet的了!直接优化小目标检测性能,不卷ImageNet-1K数据集!...

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达前言传统的基于深度学习的目标检测网络在数据预处理阶段常通过调整图像大小以达到特征图中的统一尺寸和尺度。调整大小的目的是为了便于模型传播和全连接分类。然而,调整大小不可避免地导致图像中目标的变形和信息丢失。对于具有线性形状和少量像素的微小目标(如配电塔)来说,这一缺点尤为明显。为了解决这个问题,作者提出放弃调整大小的操作。相反,...

2024-04-16 10:05:21 25

转载 软包装锂离子电池的表面凸点缺陷检测

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达来源:《电池》作者:曾臻1,2,王宏博1,2∗,王正家1,2,何涛1,2(1.现代制造质量工程湖北省重点实验室,湖北 武汉 430068;2.湖北工业大学机械工程学院,湖北 武汉 430068)作者简介:曾臻(1986-),男,湖北人,湖北工业大学机械工程学院讲师,研究方向:机器视觉、精密光电检测技术及设备开发;王宏博(1997...

2024-04-16 10:05:21 41

转载 使用 OpenCV 构建文档扫描仪

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达介绍在本文中,我们将使用 OpenCV 库来开发 Python 文档扫描器。OpenCV 的简要概述: OpenCV 是一个开源库,用于各种计算机语言的图像处理,包括 Python、C++ 等。它可用于检测照片(例如使用人脸检测系统的人脸) 。要了解更多关于 OpenCV 的信息,你可以在此处参考他们的官方文档:https://...

2024-04-16 10:05:21 38

转载 Nature发布2024年值得关注的七项技术

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达转载自 | 机器学习初学者来源 |医工学人前言从蛋白质工程、3D打印,到深度伪造介质的检测,以下是《自然》期刊在未来一年将关注的七个技术领域。插图:双胞胎项目Nature | Technology Feature一、用于蛋白质设计的深度学习二十年前,西雅图华盛顿大学的大卫·贝克(David Baker)和他的同事们取得了一项...

2024-04-15 10:05:25 29

转载 最新大模型论文研究论文合集,包含谷歌/苹果/亚马逊/港大、阿里最新研究报告!...

清华团队推出 MiniCPM:利用可扩展的训练策略挖掘小模型潜力;苹果MM1大模型:30B参数,多模态,在预训练指标上达到SOTA;亚马逊提出大规模视频语言对齐方法VidLA;英伟达参与,高效视频扩散模型CMD发布;谷歌、Stability AI新研究:由文本引导生成纹理3D服装;港大、阿里新研究:只需一张图,轻松即时定制个性化照片;上海 AI Lab 新研究:将 LVLM 分辨率提升到 4K H...

2024-04-15 10:05:25 63

转载 少样本/零样本学习方向开源数据集汇总

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达编辑丨极市平台极市导读本文汇总了少样本/零样本相关的数据集资源,均附有下载链接,更多数据集资源汇总:https://www.cvmart.net/dataSets。往期回顾:医学影像相关开源数据集资源汇总卡车货车、野外火灾、抽烟识别等开源数据集资源汇总面部表情识别相关开源数据集资源汇总打架识别相关开源数据集资源汇总(附下载链...

2024-04-15 10:05:25 35

转载 人工智能揭示矩阵乘法的新可能性

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达编者荐语如果机器学习能够发现一种全新的算法理念,这将改变游戏规则。转载自丨ScienceAI数学家酷爱漂亮的谜题。当你尝试找到最有效的方法时,即使像乘法矩阵(二维数字表)这样抽象的东西也会感觉像玩一场游戏。这有点像尝试用尽可能少的步骤解开魔方——具有挑战性,但也很诱人。除了魔方,每一步可能的步数为 18;对于矩阵乘法,即使在相...

2024-04-15 10:05:25 15

转载 CVPR 2024 | 视觉新突破!首个无自然语言的纯视觉大模型!

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨机器之心来源丨机器之心编辑丨极市平台极市导读仅靠视觉(像素)模型能走多远?UC 伯克利、约翰霍普金斯大学的新论文探讨了这一问题,并展示了大型视觉模型(LVM)在多种 CV 任务上的应用潜力。最近一段时间以来,GPT 和 LLaMA 等大型语言模型 (LLM) 已经风靡全球。另一个关注度同样很高的问题是,如果想要构建大型...

2024-04-14 10:10:56 39

转载 假如,在一家公司死磕10年...

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者:沈世钧 | 转自:公子龙最近在知乎上看到一个话题:那些在一个公司死磕了5-10年的人最后都怎么样了?在互联网红利爆发,人心躁动的今天,可以在一个公司磕到5~10年,真的很不容易,我记得前东家要是有人呆满8年,就可以鲜花伺候,附送一个小金块,据说价值不菲。下面是知乎作者沈世钧的一个回答,感觉还不错,分享给大家。我是一名老程序...

2024-04-14 10:10:56 30

转载 卷积神经网络结构组成与解释

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达卷积神经网络是以卷积层为主的深度网路结构,网络结构包括有卷积层、激活层、BN层、池化层、FC层、损失层等。卷积操作是对图像和滤波矩阵做内积(元素相乘再求和)的操作。1. 卷积层常见的卷积操作如下:卷积操作解释图解标准卷积一般采用3x3、5x5、7x7的卷积核进行卷积操作。‍‍‍‍‍‍‍分组卷积将输入特征图按通道均分为 x 组,然...

2024-04-14 10:10:56 26

转载 拿什么拯救我的 4G 显卡: PyTorch 节省显存的策略总结

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者|OpenMMLab 编辑| 极市平台原文链接:https://zhuanlan.zhihu.com/p/430123077导读随着深度学习快速发展,同时伴随着模型参数的爆炸式增长,对显卡的显存容量提出了越来越高的要求,如何在单卡小容量显卡上面训练模型是一直以来大家关心的问题。本文结合 MMCV 开源库对一些常用的节...

2024-04-14 10:10:56 17

转载 高校老师因发消息爱打问号被学生投诉!被学校撤职后反手上诉获赔13万

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达本文募格学术撰写。参考来源:《纽约邮报》、观察者网、知乎、豆瓣、北京时间等一连打几个问号“???”,你在给别人发信息的时候会有这样的习惯吗?据纽约邮报报道,英国的一位高校讲师,就因为发信息太爱加问号“???”,被学生投诉之后,被学校撤职了。(后来老师又在法庭上状告了学校并拿到了1.44万英镑赔偿)看来网络上的师生沟通,还真是...

2024-04-13 13:04:06 18

转载 建立重复图像查找系统

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达是否要识别重复或接近重复的图像?或者计算数据集中每个图像的副本数?如果是,那么这篇文章是给你的。本文的目标有五个方面:理解重复图像查找器和基于内容的图像检索系统之间的区别演练比较相似图像的5种不同方法的概念学习python中的每个方法实现确定图像变换对所述算法整体性能的灵敏度为在速度和准确性方面选择适合你应用的最佳方法的选择过程...

2024-04-13 13:04:06 22

转载 积神经网络原来是这样实现图像识别的

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者:Savaram Ravindra来源:mindmajix.com图像识别是非常有趣和具有挑战性的研究领域。本文阐述了卷积神经网络用于图像识别的概念、应用和技术。什么是图像识别,为什么要使用它?在机器视觉领域,图像识别是指软件识别人物、场景、物体、动作和图像写入的能力。为了实现图像识别,计算机可以结合人工智能软件和摄像机使用...

2024-04-12 10:05:21 22

Python视觉实战项目31讲.pdf

本手册中主要涉及以下几部分,首先是对 OpenCV中自带的基本函数进行介绍。其次是OpenCV的实战项目,一方面是基于实际项目利用OpenCV实现特定对象的检测,例如车道线检测、路面的坑洼检测、等;另一方面是基于OpenCV实现图像增强,例如利用OpenCV消除运动所引起的图像模糊等。最后是OpenCV与深度学习等其他相结合实现图像分割、人脸检测、运动检测等难度较大的问题。

2020-10-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除