自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1329)
  • 资源 (11)
  • 收藏
  • 关注

原创 干货 | 利用手持摄像机图像通过卷积神经网络实时进行水稻检测

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式获取论文:关注并回复“水稻”计算机视觉研究院专栏Column of Computer Vision Institute小农户在全球粮食供应中发挥着重要作用。随着智能手机越来越普及,它们使小农能够以非常低的低成本收集图像。PART/1摘要在本研究中,研究者提出了一种有效的深度卷积神经...

2024-01-07 10:30:55 895

原创 YoloV8与ChatGPT互通,这功能是真的强大!

点击蓝字 关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式参考地址:https://github.com/ultralytics/ultralytics计算机视觉研究院专栏Column of Computer Vision Institute现在的ChatGPT都是输入文字、图片或者语音,那如果将检测网络或者更上层一点的东西,把视觉与ChatG...

2023-07-12 08:26:47 288

转载 1500+车载摄像头/激光雷达产业链6月21集结苏州!EAC2024自动驾驶传感器产业展览会即将起航!...

往届部分重磅演讲嘉宾向下滑动查看更多海外主机厂嘉宾强势加入!EAC2024将呈现前所未有的海外阵容,目前已邀请到来自中国、北美、欧洲、日韩、中东、东南亚的重磅主机厂嘉宾和企业,以演讲、采购团等形式参与活动现场。如智能驾驶板块的Toyota、Volvo、stellantis、vinfast、NWTN、Continental,智能座舱板块Euro NCAP,广汽LA执行设计总监Pontus Fonta...

2024-04-24 08:00:00 8

转载 “大模型”根基—Transformer的360篇论文大盘点

2017年,来自谷歌的几个研究员写下《Attention is All you need》的题目,给世界带来了Transformer模型架构,它成为了今天“大模型”繁荣背后无可争议的根基。 OpenAI的GPT,Meta的Llama以及一众最主流大语言模型都是在Transformer的基础上生长起来,某种程度上,今天所有AI模型层面的研究都在围绕对Transformer的掌控与超越展开。如何快...

2024-04-16 11:00:44 89

转载 CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文地址:https://arxiv.org/pdf/2312.03502.pdf项目地址:https://github.com/Zhang-Haojie/WeSAM论文标题:Improving the Generalization of Segmentation Foundation M...

2024-04-16 11:00:44 55

转载 马斯克的首款多模态大模型来了,GPT-4V又被超越了一次

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute自从 2023 年 11 月 Grok 首次亮相以来,马斯克的 xAI 正在大模型领域不断取得进步,向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月,xAI 的首个多模态模型就问...

2024-04-15 11:00:17 21

转载 Meta宣布全新训推一体加速器:完全集成PyTorch 2,性能3倍提升

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision InstituteMeta 疯狂砸入数十亿美元,一部分招揽人才,一部分造芯片。Meta 正在不遗余力地想要在生成式 AI 领域赶上竞争对手,目标是投入数十亿美元用于 AI 研究。这些巨资一部分用于招募 AI 研究员。但...

2024-04-15 11:00:17 11

转载 7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式还可以处理高难度算法题,比如经典的分糖果问题,通过贪心的策略,以左右两次遍历的方式得到最少糖果数。再来看 aiXcoder 7B Base 版更得心应手的代码补全场景,比如长上下文补全。这里用多个工具函数拼成 1500 多行的代码,要求模型在文件末端进行注释补全,模型识别到了文件顶部的相关...

2024-04-12 11:00:29 41

转载 谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision InstituteGecko 是一种通用的文本嵌入模型,可用于训练包括文档检索、语义相似度和分类等各种任务。文本嵌入模型在自然语言处理中扮演着重要角色,为各种文本相关任务提供了强大的语义表示和计算能力。在语义表示上,文...

2024-04-08 11:31:13 24

转载 马斯克造大模型,从特斯拉连挖高管

点击蓝字 关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute要不他们可能就跳槽到 OpenAI 了。当全球首富埃隆・马斯克(Elon Musk)建立 xAI,准备与 OpenAI、谷歌竞争大模型时,他必须与众多科技巨头、初创公司争夺人才。不过,他使用了一些取...

2024-04-07 11:30:26 25

转载 王炸更新!YOLO v9颠覆实时目标检测领域(含yolo全系列)

YOLOv9的变化相对较小,它仍然基于YOLOv5的代码架构。这就意味着YOLOv5、YOLOv7和YOLOv9实际上是“同一个框架”。如果你已经熟悉其中一个,那么你将能够轻松掌握另外两个。研梦非凡请一线车企高级算法工程师Frank导师从yolo v9的两个创新点开始,到网络结构、实验、代码详细讲解,带你搞定yolo v9算法!扫码预约4月8号《前沿算法论文解读系列直播——YOLOV9算法详解...

2024-04-06 13:30:34 107

转载 比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA...

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute2022 年底,随着 ChatGPT 的爆火,人类正式进入了大模型时代。然而,训练大模型需要的时空消耗依然居高不下,给大模型的普及和发展带来了巨大困难。面对这一挑战,原先在计算机视觉领域流行的 LoR...

2024-04-02 10:40:23 41

转载 深度学习部署、大模型/多模态的全栈学习社区汇总!

今年来,各家自动驾驶与AI公司开始规模化量产,可落地的技术成为大家争先占领的重点,然而这个行业对从业者能力要求较高,内部非常卷,一个岗位难求。如何从内卷中脱颖而出,除了极强的自律外,系统的学习方法也很重要,这里给大家推荐了几个国内非常具有影响力的自动驾驶、计算机视觉和AI方面的优质社区,对入门学习以及后续进阶很有帮助!StrongerTang机器人、自动驾驶人才聚集地,感知融合、定位建图、规划控制...

2024-03-30 12:35:45 39

转载 自动驾驶idea|在线矢量化高清地图构建的结构化建模和学习

高清(HD)地图提供了丰富而精确的驾驶场景环境信息,是自动驾驶系统规划中不可或缺的基本组成部分。MapTR一种高效在线矢量化高清地图构建的端到端结构框架:它采用简单的编码器-解码器-转换器架构和分层二分匹配来执行基于所提出的置换等价建模的地图元素学习。研梦非凡邀请某知名研究所研究员周导师在3月29日晚19:20,带大家从MapTR的算法框架中地图元素建模方法到MapTR框架应用于自动驾驶领域的实现...

2024-03-29 11:31:20 32

转载 离职谷歌的Transformer作者创业,连发3个模型(附技术报告)

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文标题:GLEE: General Object Foundation Model for Images and Videos at Scale论文地址:https://arxiv.org/abs/2312.09158代码地址:https://github.com/FoundationV...

2024-03-26 10:01:21 38

转载 CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文标题:GLEE: General Object Foundation Model for Images and Videos at Scale论文地址:https://arxiv.org/abs/2312.09158代码地址:https://github.com/FoundationV...

2024-03-24 18:30:54 53

原创 Github 4.8k Stars! | CodeFormer: 地表最强AI马赛克去除神器! (附实战教程)

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式项目地址:https://shangchenzhou.com/projects/CodeFormer/#method先来一组效果图:转换前:转换后:计算机视觉研究院专栏Column of Computer Vision Institute模糊的脸恢复是一个高度不适定的问题,通常需要辅助指导...

2024-03-22 13:30:28 875

转载 马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式项目地址 https://github.com/xai-org/grok-1计算机视觉研究院专栏Column of Computer Vision Institute开源社区有福了。项目地址 https://github.com/xai-org/grok-1pip install -r r...

2024-03-20 11:30:20 65

转载 苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文地址:https://arxiv.org/pdf/2403.09611.pdf计算机视觉研究院专栏Column of Computer Vision Institute苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。监督微调结果最后,研究者...

2024-03-16 17:30:39 119

原创 太强了!斯坦福继Flash Attention V1和V2又推出Flash Decoding

背景知识Hardware角度GPU Software 编程角度Hardware和Software的联系研梦非凡的导师来自海外QStop80、国内华五、C9、985高校的教授/博士导师/博士后,世界500强公司算法工程师,国内外知名人工智能实验室研究员。(以下仅展示部分导师)导师均来自科研一线,购买联系助教后,可根据学员需求匹配导师库导师~~

2024-03-16 16:11:23 891

转载 智能体的ChatGPT时刻!DeepMind通用AI向人类玩家进化,开始理解游戏

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文下载|回复“DSGN”获取源码论文:https://arxiv.org/pdf/2001.03398.pdf计算机视觉研究院专栏Column of Computer Vision Institute在 AI 智能体这个领域,谷歌 DeepMind 又有了一项里程碑式研究。视频游戏是...

2024-03-15 11:31:45 40

转载 350亿参数、开放权重,Transformer作者创业后推出新大模型

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute开源大语言模型宇宙又来了一个强劲对手。Transformer 作者参与创立的Cohere公司推出的大模型Command-R 在可扩展、RAG和工具使用三个方面具有显著的优势。今天,由 Trans...

2024-03-14 10:30:32 23

原创 YOLOv9

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute现在的深度学习方法侧重于如何设计最合适的目标函数,使模型的预测结果最接近实际情况。同时,必须设计一种适当的架构,该架构可以促进获取足够的信息用于预测。PART/1前言现有的方法忽略了一个事实,...

2024-03-13 11:30:51 786

转载 OpenAI开源了:Transformer自动debug工具上线GitHub

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute不用敲代码,就可以快速探索模型结构。最近时常被吐槽不够开源的 OpenAI,突然开放了一次。今天一早,OpenAI 机器学习研究员 Jan Leike 宣布,OpenAI 开放了自己内部一直用于分析 ...

2024-03-13 11:30:51 69

转载 招贤纳士,春季招聘来了!帮忙内推

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute招聘算法工程师、前后端工程师!开发工程师【职位描述】1, 负责AI平台后台服务开发和维护;2, 负责用户需求收集、整理,需求到软件需求的分解;3, 能够持续研究Java后端服务前沿技术;4, 有较强的...

2024-03-13 11:30:51 24

原创 SuperYOLO:多模态遥感图像中的超分辨率辅助目标检测(附源代码)

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式源码地址:https://github.com/icey-zhang/SuperYOLO计算机视觉研究院专栏Column of Computer Vision Institute准确及时地从遥感图像中检测包含数十个像素的多尺度小物体仍然具有挑战性。大多数现有的解决方案主要设计复杂的深度神经...

2024-03-13 11:30:51 1079

转载 比标准Attention提速5-9倍,大模型都在用的FlashAttention v2来了

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式项目地址:https://github.com/Dao-AILab/flash-attention技术报告:https://tridao.me/publications/flash2/flash2.pdf计算机视觉研究院专栏Column of Computer Vision Institu...

2024-03-12 11:30:32 39

转载 把大模型压缩到了1bit,放到手机里跑的愿望快要实现了!

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文标题:OneBit: Towards Extremely Low-bit Large Language Models论文地址:https://arxiv.org/pdf/2402.11295.pdf计算机视觉研究院专栏Column of Computer Vision Institut...

2024-03-12 11:30:32 30

转载 突破内存瓶颈,让一块4090预训练7B大模型

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文地址:https://arxiv.org/abs/2403.03507论文标题:GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection计算机视觉研究院专栏Column of Computer Visio...

2024-03-12 11:30:32 209

转载 超越Transformer,突破大模型注意力层瓶颈

斯坦福大学此前提出的FlashAttention算法,能够在BERT-large训练中节省15%,将GPT训练速度提高2/3。此后又提出FlashAttention V2,拥有了更好的并行性和工作分区,让计算提速200%,上下文长度扩展更任性!Flash-Decoding不仅借鉴了FlashAttention的优点,同时可以显著加快推理过程中的注意力,使非常长的序列的生成速度提高8倍。也可以极大提...

2024-03-12 11:30:32 40

转载 远距离的小目标也可以准确检测

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文地址:https://openaccess.thecvf.com/content/WACV2024/papers/Zhang_Patch-Based_Selection_and_Refinement_for_Early_Object_Detection_WACV_2024_paper....

2024-03-11 11:30:16 25

转载 简单易上手!LLMs在自动驾驶领域应用的框架

LangProp是一个将语言模型应用于驾驶的代码优化框架,使用LLMs实现数据驱动代码优化的框架,并且证明了其在CARLA中生成驾驶策略的能力,做模型融合的一定要学习一下。研梦非凡邀请中科院某所研究员周老师为大家详细讲解《LLMs在自动驾驶中的应用》,从LangProp算法框架的原理,到LangProp框架应用于自动驾驶领域的实现细节和实验结果。扫码找助教预约免费直播再领取LLMs/自动驾驶156...

2024-03-10 11:59:41 39

转载 田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文地址:https://arxiv.org/abs/2403.03507论文标题:GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection计算机视觉研究院专栏Column of Computer Visio...

2024-03-10 11:59:41 27

转载 全面超越GPT-4,Claude 3终于来了,支持百万token

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute性能比 GPT-4 强很多。不过,也有人表示,在实际体验方面,Claude 3 并没有彻底击败 GPT-4。Claude 3 系列模型报告地址:https://www-cdn.anthropic.co...

2024-03-06 10:01:22 28

转载 RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文标题:Griffin: Mixing Gated Linear Recurrences with Local Attention for Efficient Language Models论文链接:https://arxiv.org/pdf/2402.19427.pdf计算机视觉研究院...

2024-03-04 10:30:52 51

转载 清华、哈工大把大模型压缩到了1bit,放到手机里跑的愿望快要实现了!

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文标题:OneBit: Towards Extremely Low-bit Large Language Models论文地址:https://arxiv.org/pdf/2402.11295.pdf计算机视觉研究院专栏Column of Computer Vision Institut...

2024-03-04 10:30:52 31

转载 FlashAttention加速升级!又快了200%!

斯坦福大学此前提出的FlashAttention算法,突破了Transformer增加序列长度时的注意力层瓶颈,实现了显著的内存节省和计算加速。而发布不久的FlashAttention v2,更是比v1快了200%,进一步优化了算法、并行性和工作分区,适用于更多AI大模型,为上下文长度扩展保驾护航!为了让大家快速掌握最新成果,研梦非凡特请来了该领域科研大牛,定制了直播课《AI前沿论文解析系列—...

2024-03-04 10:30:52 34

原创 YOLOv9王炸!使用可编程梯度信息学习想要学习的内容

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute现在的深度学习方法侧重于如何设计最合适的目标函数,使模型的预测结果最接近实际情况。同时,必须设计一种适当的架构,该架构可以促进获取足够的信息用于预测。PART/1前言现有的方法忽略了一个事实,...

2024-03-01 10:30:49 975

转载 微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式论文地址:https://arxiv.org/pdf/2402.17764.pdf论文标题:The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits计算机视觉研究院专栏Column of Computer Visio...

2024-03-01 10:30:49 30

原创 视觉类表面缺陷检测项目相关技术总结(下)

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute继续接着昨天的分享,将后面的训练和部署给大家分享!PART/6训练和调优迭代PART/7模型部署PART/8 一些节省推理延迟的trickPART/9后续运维PART/1...

2024-02-29 11:30:23 342

中文语音识别模型数据集

中文语音识别模型数据集

2023-02-27

简单明了的贝叶斯网络介绍

简单明了的贝叶斯网络介绍,如果你是想认真学习,有贝叶斯基础的,都可以阅读。书中从简单的概率论到各种实际应用,都是不错的讲解,有兴趣的可以下载阅读。

2019-02-26

vatic安装文件

视频标注工具,特别好用的工具,你值得拥有,如果你是做视频类的领域,可以试试该工具。

2018-12-25

faster-rnn目标检测

一步到位的目标检测教程,很容易上手,而且容易学会目标检测。

2018-01-10

Face++技术

非常先进的人脸检测技术,在各种流行的数据集中都有最好的结果。

2018-01-09

深度学习合集

紧密相关的书籍,对您肯定有帮助。神经网络,深度学习,概率论,统计,机器学习该有的都有,适合初学者入门学习。如果想了解更多,请关注微信公众号:计算机视觉战队,里面有更多的资料和干货,谢谢!

2017-12-14

caffe学习资料

高清版,希望对您有帮助,如果想了解更多,请关注微信公众号:计算机视觉战队,里面有更多的资料和干货,谢谢!

2017-12-12

Caffe可视化

为了更好的学习深度学习,抓们做一个可视化程序,方便看清楚吗,,每一层到底学习了什么,方便后期的学习与调参!

2016-11-12

深度学习数据集标注

主要用于图像中目标检测,快速标注出目标的具体位置吗,方便使用者训练测试,减轻了人工标注的精力!

2016-11-12

深度学习工具(Caffe)

最新版本的Caffe,也是何凯明老师最近更新,希望对这领域的你有帮助,谢谢!

2016-10-26

深度学习代码

专门提供给初学者使用的代码,代码都有注解,方便使用者快速使用并学习怎么操作,如有错误请指正,谢谢!

2016-10-25

深度学习——keras

深度学习初学代码,基于Python语言在Mnist数据库实验的代码。

2016-02-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除