- 博客(1391)
- 资源 (37)
- 收藏
- 关注
转载 谷歌官方回应:我们没有放弃TensorFlow,未来与JAX并肩发展
作者丨陈萍来源丨机器之心TensorFlow 不是谷歌的一枚「弃子」,将会继续开发。前段时间,AI 界流传着这样一种说法,大概意思就是说,TensorFlow 已经成为了谷歌的一枚「弃子」。更是有外媒 Business Insider 采访了一系列开发人员、硬件专家、云供应商以及与谷歌机器学习工作关系密切的人,获得了同样的观点:2015 年诞生的 TensorFlow,曾...
2022-07-03 00:00:20
467
转载 带角度的检测框 | 校准的深度特征用于目标检测(附实现源码)
点击上方“3D视觉工坊”,选择“星标”干货第一时间送达作者丨Edison_G来源丨计算机视觉研究院在过去的十年里,在目标检测方面取得了重大进展,这些目标通常以大规模变化和任意方向分布。然而,现有的大多数方法依赖于具有不同尺度、角度和长宽比的启发式定义anchor,通常在anchor boxes和axis-aligned的卷积特征之间存在严重的不对准,这导致分类分数和定位精...
2022-07-02 00:01:00
753
1
转载 Pytorch里面多任务Loss是加起来还是分别backward?
作者丨歪杠小胀@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/451441329编辑丨极市平台导读如果只有一个loss,那么直接loss.backward()即可,但是不止一个loss时,就不知道将backward()放在哪里了。本文作者总结了一些自己在遇到该问题时的解决方式,希望能和大家一起讨论交流~记录写这篇文章的初衷最近在复现一篇...
2022-07-01 11:00:03
3840
转载 经典论文 | 300FPS,超快结构感知的深度车道检测
来源丨CV技术指南前言现代的车道线检测的主要做法是将车道检测视为像素分割的问题,这样做很难解决具有挑战性的场景和速度问题。受到human perception的启发,即严重遮挡和极端光照条件下的车道识别主要基于背景信息和全局信息。作者提出一种新颖、简单而有效的方式,旨在实现极快的速度和具有挑战性的场景。作者将车道检测的过程看作是一个使用全局特征的基于行的选择问题,在全...
2022-07-01 11:00:03
539
转载 CVPR22 |CMT:CNN和Transformer的高效结合(开源)
作者丨王云鹤@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/534567826编辑丨极市平台导读到底CNN和Transformer哪个更好?当然是强强联手最好。华为诺亚实验室的研究员提出一种新型视觉网络架构CMT,通过简单的结合传统卷积和Transformer,获得的网络性能优于谷歌提出的EfficientNet,ViT和MSRA的Swi...
2022-06-30 11:00:26
8492
1
转载 PointDistiller:面向高效紧凑3D检测的结构化知识蒸馏
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达作者丨吃饭机@知乎来源丨https://zhuanlan.zhihu.com/p/2009241810. 引言知识蒸馏是一种在繁琐的模型中提炼知识并将其压缩为单个模型的方法,以便可以将其部署到实际应用中。随着3D目标检测在自动驾驶、虚拟现实等任务中越来越重要,知识蒸馏等模型提炼技术也被证明了有效性。本文将为大家分享2...
2022-06-29 11:00:09
1028
1
转载 Pytorch - 分布式通信原语(附源码)
作者丨颜挺帅@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/478953028编辑丨极市平台导读本文用通过pytorch中的分布式原语库来介绍每个通信原语的行为表现,主要对point-2-point communication 和collective communication两种通信方式进行介绍,并附有相关代码。前言由于工作需要,最近在...
2022-06-28 07:00:08
1386
转载 图神经网络也能用作CV骨干模型,华为诺亚ViG架构媲美CNN、Transformer
来源丨机器之心华为诺亚实验室的研究员发现图神经网络(GNN)也能做视觉骨干网络。将图像表示为图结构,通过简洁高效的适配,提出一种新型视觉网络架构 ViG,表现优于传统的卷积网络和 Transformer。在 ImageNet 图像识别任务,ViG 在相似计算量情况下 Top-1 正确率达 82.1%,高于 ResNet 和 Swin Transformer。论文链接:ht...
2022-06-27 11:00:43
277
转载 首个大众可用PyTorch版AlphaFold2复现,哥大开源OpenFold,star量破千
作者丨小舟来源丨机器之心AlphaFold2 是 2021 年 AI for Science 领域最耀眼的一颗星。现在,有人在 PyTorch 中复现了它,并已在 GitHub 上开源。这一复现在性能上媲美原版 AlphaFold2,且在算力、存储方面的要求对于大众来说更加友好。刚刚,哥伦比亚大学系统生物学助理教授 Mohammed AlQuraishi 在推特上宣布,他...
2022-06-25 00:00:08
663
转载 国内首次!3位清华姚班00后学霸斩获计算机理论顶会最佳学生论文奖
作者丨Joey 好困来源丨新智元【导读】2022年计算机理论顶会STOC正式开幕,来自清华姚班的三位00后学霸斩获最佳学生论文奖。近日,理论计算机科学领域顶级国际会议第54届ACM计算理论年会(STOC 2022)拉开帷幕。清华姚班的三位00后学霸范致远、李嘉图与杨天祺,凭借着「伪随机函数的精确复杂性与计算复杂性理论中自举现象的黑盒自然证明障碍」夺得最佳学生论文奖。从左至...
2022-06-24 11:00:52
662
转载 RepOptimizer: 其实是RepVGG2
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达作者丨zzk来源丨GiantPandaCV前言在神经网络结构设计中,我们经常会引入一些先验知识,比如ResNet的残差结构。然而我们还是用常规的优化器去训练网络。在本工作中,我们提出将先验信息用于修改梯度数值,称为梯度重参数化,对应的优化器称为RepOptimizer。我们着重关注VGG式的直筒模型,训练得到Rep...
2022-06-24 11:00:52
299
转载 扎克伯格上手演示四款VR头显原型机,Meta透露元宇宙「家底」
来源丨机器之心通过 VR 设备,Meta 探索元宇宙的脚步始终没有停下。今日,Meta CEO 扎克伯格和 AR/VR 部门 Reality Labs 首席科学家 Michael Abrash 在虚拟圆桌会议上展示了他们最新的 VR 头显原型机,共有四款设备,代号分别为 Butterscotch、Starburst、Holocake 2 和 Half Dome。这次展示活...
2022-06-23 11:00:12
206
转载 Shunted Self-Attention | 源于 PvT又高于PvT,解决小目标问题的ViT方法
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达作者丨ChaucerG来源丨集智书童最近的 Vision Transformer (ViT) 模型在各种计算机视觉任务中都展示了不错的性能,这要归功于其通过Self-Attention对图像块或Token的远程依赖关系进行建模的能力。然而,这些模型通常指定每一层内每个Token特征的相似感受野。这种约束不可避免地限制...
2022-06-22 07:00:25
848
转载 元宇宙大杀器来了!小扎祭出4款VR头显,挑战视觉图灵测试
作者丨拉燕 好困如願来源丨新智元【导读】在元宇宙里,假如技术跟不上,别的都白扯。这不,小扎带着4款头显模型来了。当小扎一口气掏出4台VR模型机的时候,我们就知道,他玩儿真的了。如果说之前搞元宇宙是噱头的话,那当小扎把这些「硬通货」掏出来...咱就只有膜拜的份儿了。从小扎的笑容上看,应该是信心满满。视觉图灵测试:四大挑战,一一攻破距离Meta改名也快一年了,然而大家齐...
2022-06-22 07:00:25
427
转载 计算机视觉中的论文常见单词总结
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达作者丨仿佛若有光157来源丨CV技术指南前言本文对计算机视觉论文中常出现的单词进行了汇总,对于不具备直接阅读英文文献的读者,可以考虑把这些单词给背了。之前的文章《计算机视觉中的高效阅读论文的方法总结》中提到了如何掌握阅读英文文献的能力,我就是按照这个方法来做的,下面是我在执行过程中记录的单词。差不多在背完这些单词...
2022-06-21 11:00:13
646
转载 对比学习(Contrastive Learning)综述
作者丨光某人@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/346686467编辑丨极市平台A.引入深度学习的成功往往依赖于海量数据的支持,其中对于数据的标记与否,可以分为监督学习和无监督学习。1. 监督学习:技术相对成熟,但是对海量的数据进行标记需要花费大量的时间和资源。2. 无监督学习:自主发现数据中潜在的结构,节省时间以及硬件资源。2...
2022-06-20 07:00:33
2628
转载 打破ViT的实际应用限制!沈春华老师团队提出无需解码器的目标检测器DFFT
作者丨ChaucerG来源丨集智书童编辑丨极市平台导读作者提出了一种完全基于Transformer且无解码器(DFFT)的目标检测器,首次在训练和推理阶段都实现了高效率。DFFT在一系列低资源约束(例如,从 40 到 100 GFLOPs)中实现了更高的准确度和更好的训练推理效率。论文链接:https://arxiv.org/abs/2206.06829ViT正在改变...
2022-06-19 00:00:43
901
转载 Gartner权威报告:鹅厂计算机视觉,世界第二
作者丨好困 桃子来源丨新智元【导读】腾讯的计算机视觉能力首次进入全球Top2的评分排名!Gartner最新发布的2022年度《Magic Quadrant for Cloud AI Developer Services》是业内权威的云计算评估报告之一,评估对象包括亚马逊、微软、谷歌等全球云厂商。在核心产品能力评估中,腾讯的计算机视觉凭借出色的产品服务能力,获得了全球Top...
2022-06-18 00:00:30
538
转载 CVPR2022 | PanopticDepth:深度感知全景分割的统一框架
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达作者丨简单来源丨CV技术指南前言本文提出了一种基于深度感知的全景分割(DPS)的统一框架,旨在从一幅图像中重建具有实例级语义的三维场景。该框架将动态卷积技术应用于全景分割(PS)和深度预测任务中,以生成特定于实例的内核来预测每个实例的深度和分割掩码。此外,利用实例级深度估计方案,添加了额外的实例级深度线索,以通过...
2022-06-17 00:11:42
768
转载 Geoffrey Hinton 最新访谈:不出五年,我们就会破解大脑的运作机制,但不是通过反向传播...
整理|李梅、黄楠(AI科技评论)编辑|陈彩娴过去十年,AI 在计算机视觉、语音识别、机器翻译、机器人、医学、计算生物学、蛋白质折叠预测等等领域取得了一个又一个突破,而这些突破的背后,均离不开深度学习。那么,深度学习起源于何时何地,又在何时成为最突出的AI方法?最近,UC伯克利教授、深度学习专家Pieter Abbeel在其播客节目《机器人大脑》(Robot Brains...
2022-06-17 00:11:42
276
转载 被PyTorch打爆!谷歌抛弃TensorFlow,押宝JAX
作者丨拉燕如願 好困来源丨新智元【导读】谷歌Meta之争看来还没完!TensorFlow干不过还有JAX,二番战能否战胜PyTorch?很喜欢有些网友的一句话:「这孩子实在不行,咱再要一个吧。」谷歌还真这么干了。养了七年的TensorFlow终于还是被Meta的PyTorch干趴下了,在一定程度上。谷歌眼见不对,赶紧又要了一个——「JAX」,一款全新的机器学习框架。最近...
2022-06-16 07:00:36
238
转载 改进Yolov5 | 用 GSConv+Slim Neck 一步步把 Yolov5 提升到极致!!!
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达作者丨ChaucerG来源丨集智书童目标检测是计算机视觉中一项艰巨的下游任务。对于车载边缘计算平台,大模型很难达到实时检测的要求。而且,由大量深度可分离卷积层构建的轻量级模型无法达到足够的准确性。因此本文引入了一种新方法 GSConv 来减轻模型的复杂度并保持准确性。GSConv 可以更好地平衡模型的准确性和速度...
2022-06-16 07:00:36
15210
7
转载 轻量级网络如MobileNet还适合继续剪枝操作,进一步压缩模型吗?
作者丨LiteAI@知乎(已授权)来源丨https://www.zhihu.com/question/343562568/answer/2514880247编辑丨极市平台导读分享一篇ICML2022文章,关于实现硬件友好方式压缩网络的新范式,其能在基于MobileNetV2的网络上进行剪枝,且在移动端/边缘端Google Pixel 3/Raspberry Pi 4的性...
2022-06-15 11:00:41
596
转载 一行代码完成模型训练,30倍加速,3毫秒急速识别,超强图像分类算法开源!...
人脸、车辆、人体属性、卡证、交通标识等经典图像识别能力,在我们当前数字化工作及生活中发挥着极其重要的作用。业内也不乏顶尖公司提供的可直接调用的API、SDK,但这些往往面临着定制化场景泛化效果不好、价格昂贵、黑盒可控性低、技术壁垒难以形成多诸多痛点。而今天小编要给大家推荐的是一个完全开源免费的、覆盖人、车、OCR等9大经典识别场景、在CPU上可3毫秒实现急速识别、一行代码...
2022-06-14 15:11:13
367
转载 搞懂Transformer结构,看这篇PyTorch实现就够了
作者丨Alexander Rush来源丨哈工大SCIR编辑丨极市平台下面分享一篇实验室翻译的来自哈佛大学一篇关于Transformer的详细博文。"Attention is All You Need"[1] 一文中提出的Transformer网络结构最近引起了很多人的关注。Transformer不仅能够明显地提升翻译质量,还为许多NLP任务提供了新的结构。虽然原文写得很清...
2022-06-14 15:11:13
547
转载 悼念!旷视首席科学家、旷视研究院院长孙剑博士凌晨逝世,AI痛失大牛
来源:量子位 | 公众号 QbitAI旷视首席科学家、旷视研究院院长孙剑博士,今日凌晨因病不幸离世。孙剑博士1976年10月出生,今年45岁。他曾任微软亚研院首席研究员,此前两次获CVPR最佳论文奖。他最为人所熟知的成就,是带领何恺明等人做出的残差网络ResNet。ResNet在2015年提出之后,拿下过ImageNet冠军,并斩获了CVPR 2016最佳论文奖。孙剑的博...
2022-06-14 15:11:13
281
转载 上帝捏人玩具MetaHuman重大更新!几分钟捏一张精细到发丝的脸
作者丨时光 拉燕 桃子来源丨新智元【导读】近日,UE开发的数字人类创作工具MetaHuman Creator再次迎来重大更新。网格体转MetaHuman功能可以让你在几分钟内为元宇宙超人类换脸。还记得上帝掉落凡间的玩具MetaHuman Creator吗?它可以创建从眼睛到鼻子嘴巴,甚至头发丝可见的精细化数字人类。最重要地是,用时还不到1小时。现在,这个创建元宇宙人类的工...
2022-06-13 07:00:30
649
转载 我愿称之为史上最全的深度学习面经总结(附答案详解)
作者丨马东什么@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/391954665编辑丨极市平台最近参加社招,面试基本是问项目,然后问项目里的算法所以这里还是按照实际的面试流程展开总结一下,因为做的项目里面对于不同的领域有一些涉及,所以统一整理一下免得临场忘记,当然,主业还是在machine learning上,所以还是以传统机器学习算法为主...
2022-06-12 00:00:41
4754
1
转载 MobileOne: 移动端仅需1ms的高性能骨干,你值得拥有!
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达作者丨Happy来源丨AIWalker一句话总结MobileOne(≈MobileNetV1+RepVGG+训练Trick)是由Apple公司提出的一种基于iPhone12优化的超轻量型架构,在ImageNet数据集上以<1ms的速度取得了75.9%的Top1精度。出发点高效率网络具有更强的实用价值,但学术界的...
2022-06-12 00:00:41
1633
1
转载 清北力压耶鲁,MIT蝉联第一,2023QS世界大学排名最新发布
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达作者 | 王玥编辑 | 陈彩娴来源丨AI科技评论就在今晨,2023年QS世界大学最新排名释出。据了解,今年的QS排名中包括来自世界各地的近1500所大学,多于去年的 1300 所,为有史以来规模最大的一次排名。QS官网介绍,QS世界大学排名是根据6个领域对院校进行评分并排名的。这6个领域分别是:学术声誉——占总分的4...
2022-06-11 00:00:58
174
转载 浙江大学搞出了一款无人机,自动规避障碍,像鸟一样穿过树林,真正的蜂群来了...
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达来源丨计算机视觉CV最近,在浙江安吉的一片竹林中,一群微型智能无人机正在集体出动,它们游刃有余地穿梭丛林。看,这既像军事演习,又犹如小鸟穿越林间。这些机器人编队,时而轻巧掠过丛林,时而交叉变换队形,如雁阵飞过,如蝴蝶起舞。其实,这是由浙江大学控制科学与工程学院、浙大湖州研究院完成的一项研究,发表在今...
2022-06-11 00:00:58
2354
转载 大道至简 | 设计 ViT 到底怎么配置Self-Attention才是最合理的?
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达作者丨ChaucerG来源丨集智书童Transformer已成为深度学习中的主要架构之一,尤其是作为计算机视觉中卷积神经网络 (CNN) 的强大替代品。然而,由于Self-Attention在长序列表示上的二次复杂性,特别是对于高分辨率密集预测任务,先前工作中的Transformer训练和推理可能非常昂贵。为此,我们...
2022-06-10 11:00:12
1067
转载 最全深度学习训练过程可视化工具(附github源码)
编辑丨极市平台、机器学习实验室导读本文介绍了多个能将深度学习训练过程进行可视化的工具,帮助大家更好地理解深度学习,非常实用。深度学习训练过程一直处于黑匣子状态,有很多同学问我具体怎么解释?其实很多还是无法可解释,但是通过可视化,具体可以知道深度学习在训练过程到底学习了哪些特征?到底对该目标的哪些特征感兴趣?这些我们现在已经有很多渠道可以得知,我先给大家介绍几个比较好的...
2022-06-10 11:00:12
614
转载 超强实操!手把手教学Kinect深度图与RGB摄像头的标定与配准
作者 | aipiano @CSDN编辑 | 3D视觉开发者社区导读Kinect作为微软推出的XBOX360体感周边外设,具有获取深度信息的能力。但由于Kinect自身RGB摄像头分辨率有限,其清晰度也略低,对于较高要求的开发者来说不够适用。因此,很多开发者都会使用第三方摄像头代替Kinect摄像头,但是二者之间如何配准一直是个问题。本篇就“如何将Kinect的深度图与第...
2022-06-09 11:00:41
1753
1
转载 CVPR 2022 Oral | SCI:实现快速、灵活与稳健的低光照图像增强
作者丨马龙来源丨大连理工大学编辑丨极市平台论文地址:https://arxiv.org/pdf/2204.10137.pdf代码地址:https://github.com/vis-opt-group/SCI本文提出了一种全新的低光照图像增强方案:自校准光照学习(SCI)。通过构建引入自校准模块的权重共享光照学习过程,摒弃了网络结构的繁杂设计过程,实现了仅使用简单操作进行增...
2022-06-09 11:00:41
1512
1
转载 14种异常检测方法总结
作者丨Ai来源丨宅码编辑丨极市平台本文收集整理了公开网络上一些常见的异常检测方法(附资料来源和代码)。不足之处,还望批评指正。一、基于分布的方法1. 3sigma基于正态分布,3sigma准则认为超过3sigma的数据为异常点。图1: 3sigmadefthree_sigma(s):mu,std=np.mean(s),np.std(s)low...
2022-06-07 11:00:39
6629
转载 传统车辆工程研究生以后希望从事无人驾驶相关工作,如何努力?
作者丨https://www.zhihu.com/question/400336056来源丨计算机视觉life选导师时没有选上无人驾驶方向的老师,但是还是很希望能从事此方面工作,请大佬们出出主意,自学无人驾驶方面的知识可以吗?Zhou Longfei看到楼上很多负面劝退的回答,不免恻隐,给你一些个人分析和正面建议。首先,你选择无人驾驶的朦胧感觉是对的。无人驾驶这个产业明显...
2022-06-06 07:00:56
241
转载 在C++平台上部署PyTorch模型流程+踩坑实录
作者丨火星少女@知乎来源丨https://zhuanlan.zhihu.com/p/146453159编辑丨极市平台最近因为工作需要,要把pytorch的模型部署到c++平台上,基本过程主要参照官网的教学示例,期间发现了不少坑,特此记录。1.模型转换libtorch不依赖于python,python训练的模型,需要转换为script model才能由libtorch加载,...
2022-06-06 07:00:56
2607
转载 EfficientFormer | 苹果手机实时推理的Transformer模型,登顶轻量化Backbone之巅
点击上方“计算机视觉工坊”,选择“星标”干货第一时间送达作者丨ChaucerG来源丨集智书童Vision Transformers (ViT) 在计算机视觉任务中取得了快速进展,在各种基准测试中取得了可喜的成果。然而,由于大量的参数和模型设计,例如注意力机制,基于 ViT 的模型通常比轻量级卷积网络慢几倍。因此,应用部署 ViT 具有很大的挑战性,尤其是在移动设备等资源受...
2022-06-05 00:00:01
2031
1
转载 要么到岗,要么离职!马斯克:特斯拉「远程办公」到此结束
作者丨David来源丨新智元【导读】马斯克连发两封邮件,特斯拉「远程办公」宣布结束,全员每周必须办公室到岗至少40小时,不愿意来的可以走人。疫情汹涌,「居家办公」早已成为热词。无论企业大小,员工老幼,在病毒的「无差别攻击」面前,可以说是人人平等。目前数得上的科技巨头,比如谷歌、苹果、Meta、Twitter等,员工都已经在家办公了一两年,特斯拉的大部分员工也不例外。但是今...
2022-06-04 00:00:27
1159
Mastering OpenCV with Practical Computer Vision Projects
2018-07-02
meshlab.zip
2020-06-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅