分享系列
文章平均质量分 89
分享一些实用的工具以及对行业的看法,或对某个领域的技术洞察等。
CVHub
专注多模态视觉语言AI全栈知识分享,提供原创、多领域、有深度的前沿AI论文解读与工业成熟解决方案
展开
-
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
X-AnyLabeling 是一款基于AI推理引擎和丰富功能特性于一体的强大辅助标注工具,其专注于实际应用,致力于为图像数据工程师提供工业级的一站式解决方案,可自动快速进行各种复杂任务的标定。原创 2024-08-27 00:26:45 · 1278 阅读 · 1 评论 -
无关技术细节,聊聊这两年从事大语言模型的工作感悟
转载 2024-08-23 21:46:58 · 93 阅读 · 0 评论 -
CVPR 24-UG2 无人机多模态检测与追踪挑战赛正式开启!
参赛者需要根据传感器数据序列给出特定时间戳上的无人机位置数据并提交到赛事系统中,根据分类和预测精度得出最终的得分。比赛主要分为两个阶段 算法开发阶段(Dry-run)和最终验证阶段(Testing)。在算法开发阶段(Dry-run)挑战赛提供一个有标签训练集和一个无标签的开发用数据集,参赛者需要在这一阶段完成开发模型,测试结果提交格式等任务。在最终验证阶段(Testing),挑战赛会发布一个最终数据集以验证参赛者的算法性能。原创 2024-04-16 21:02:19 · 1244 阅读 · 0 评论 -
All in One | X-AnyLabeling v2.0.0 全自动标注工具强势登场,全新功能亮相,欢迎体验升级
X-AnyLalbeing 中同样提供了丰富的快捷键,极大提升标注效率。大家可根据自己的习惯通过修改当前设备的用户根目录下的#Linux#Windows默认的快捷键设置可以参考 github 主页示意图。对于中已提供的内置模型,可参考以下操作:创建配置文件进入项目工程,查看所需的配置文件查看配置文件配置文件需要遵循以下格式,以stride: 32classes:- person- bicycle- car...原创 2023-11-16 14:16:29 · 1554 阅读 · 1 评论 -
X-AnyLabeling 2.x 版本正式发布啦! | 一款多 SOTA 模型集成的高级自动标注工具
是一款全新的交互式自动标注工具,其基于Labelme和等诸多优秀的标注工具框架进行构建,在此基础上扩展并支持了许多丰富的模型和功能,并借助和YOLO系列等目前主流和经典的深度学习模型提供强大的 AI 能力支持。无须任何复杂配置,下载即用,大大降低用户使用成本,同时支持自定义模型和快捷键设置等,极大提升用户标注效率和使用体验!项目链接:https://github.com/CVHub520/X-AnyLabeling/tree/main。原创 2023-09-12 21:58:30 · 985 阅读 · 16 评论 -
TPAMI 2023 | 生成式AI与图像合成综述
在第四章节,该综述汇集了多模态合成与编辑领域流行的数据集以及相应的模态标注,并且针对各模态典型任务(语义图像合成,文字到图像合成,语音引导图像编辑)对当前方法进行了定量的比较。在第三章节,根据图像合成与编辑的模型框架,该论文对目前的各种方法进行了分类,包括基于GAN的方法,扩散模型方法,自回归方法,和神经辐射场(NeRF)方法。在第五章节,该综述对此领域目前的挑战和未来方向进行了探讨和分析,包括大规模的多模态数据集,准确可靠的评估指标,高效的网络架构,以及3D感知的发展方向。原创 2023-09-09 10:43:06 · 110 阅读 · 0 评论 -
X-Anylabeling: 一款多SOTA深度学习模型集成的新一代自动标注工具
是一款全新的交互式自动标注工具,其基于进行构建和二次开发,在此基础上扩展并支持了许多的模型和功能,并借助和YOLO等主流模型提供强大的 AI 支持。无须任何复杂配置,下载即用,支持自定义模型,极大提升用户标注效率!本文主要为大家介绍一款新颖实用的基于交互式的全自动标注工具——,更多功能和特性可直接下载体验!源码链接:https://github.com/CVHub520/X-AnyLabeling视频教程:https://www.bilibili.com/video/BV1AV4y1U7h3/?原创 2023-06-10 21:34:06 · 5300 阅读 · 3 评论 -
AI for Science 值得研究研究吗?
Title: 知乎热议:ai for science值得研究研究吗?来源链接: https://www.zhihu.com/question/547902474。原创 2023-05-04 00:12:01 · 369 阅读 · 0 评论 -
博士招生 | 南丹麦大学方承副教授招生博士生1名
南丹麦大学 (University of Southern Denmark)是丹麦机器人研究的中心及诞生地, 其具有世界一流的机器人科研环境和设备且在协作机器人领域处于全球领先地位。著名的世界协作机器人领导者 Universal Robots (UR) 亦是方承所在的机器人研究所 (The Maersk Mc-Kinney Moller Institute) 所孵化的公司。原创 2023-04-22 13:40:51 · 271 阅读 · 0 评论 -
实习招聘 | 美团招聘视觉感知算法方向实习生
团队深耕自动驾驶领域,有国际顶尖自动驾驶企业经验(e.g., Waymo),在业内有持续影响力。团队成员代表作品有:SWFormer, BiSeNetV1/V2, Lite-HRNet, GANet, HyMo。团队近期获得知名自动驾驶比赛 Argoverse Challenge 2022 - Motion Forecasting 第三名,GigaVision Challenge 2022 - 多目标轨迹预测冠军。美团自动车招聘感知算法实习生【工作地点】北京。原创 2023-04-19 21:12:58 · 131 阅读 · 0 评论 -
深入理解 Word Embedding
One Hot Encoding是一种将类别型变量向量化的一般做法。它能够简单且快速的创建并更新向量化,只需在向量中添加一个新的项,每一项对应一个新的类别。然而,其编码长度取决于词库的大小,编码后的向量维度很大,很容易造成维度灾难。其次,它也无法体现不同词之间的关联性。Embedding则是一种需要大量语料进行训练的向量化方法,它所需要的训练时间很长,输出的结果是一组具有固定维度的密集向量。总的来说,独热编码不会告诉我们每个item的具体语义,每一个向量化均是另一个维度的正交表示。原创 2023-03-23 21:05:40 · 449 阅读 · 0 评论 -
CV-CUDA: NVIDIA 官方出品高性能图像处理加速库
如果您也对人工智能和计算机视觉全栈领域感兴趣,强烈推荐您关注有料、有趣、有爱的公众号『CVHub』,每日为大家带来精品原创、多领域、有深度的前沿科技论文解读及工业成熟解决方案!欢迎添加小编微信号:cv_huber,一起探讨更多有趣的话题!本文正在参加 人工智能创作者扶持计划。转载 2023-03-23 20:58:39 · 998 阅读 · 0 评论 -
2023年最全VSCode远程Linux搭建C++工程开发利器
2023年最全VSCode远程Linux搭建C++工程开发利器原创 2023-02-18 09:56:24 · 620 阅读 · 0 评论 -
2023年最全 Windows + VSCode 配置 OpenCV C++ 一站式开发调试环境教程
2023年最全 Windows + VSCode 配置 OpenCV C++ 一站式开发调试环境教程原创 2023-02-18 09:56:15 · 459 阅读 · 0 评论 -
为什么好多研究生都不愿意继续读博士了?
为什么好多研究生都不愿意继续读博士了?转载 2023-02-18 09:41:19 · 163 阅读 · 0 评论 -
FlexiViT: 谷歌手把手教你如何灵活切片
FlexiViT: 谷歌手把手教你如何灵活切片原创 2023-02-17 23:00:35 · 108 阅读 · 0 评论