- 博客(650)
- 资源 (20)
- 收藏
- 关注
原创 基于深度学习的细粒度图像分析综述【翻译】
细粒度图像分析(FGIA)是计算机视觉和模式识别中一个长期存在的基本问题,是一系列实际应用的基础。FGIA的任务是分析下属类别的视觉对象,例如鸟类物种或汽车模型。细粒度图像分析固有的小类间变化和大类内变化使其成为一个具有挑战性的问题。利用深度学习的进步,近年来我们见证了以深度学习为动力的FGIA的显著进步。在本文中,我们对这些进展进行了系统的综述,试图通过整合两个基本的细粒度研究领域——细粒度图像识别和细粒度图像检索,重新定义和拓宽FGIA领域。
2024-10-12 18:42:55 1123
原创 Mac 电脑配置yolov8运行环境实现目标追踪、计数、画出轨迹、多线程
Mac 电脑配置yolov8运行环境实现目标追踪、计数、画出轨迹、多线程;YOLO 推理测试、小数据集训练,基础版 Mac 即可满足
2024-09-26 18:38:23 2043 1
原创 Ubuntu 22.04 搭建 yolov8 环境 运行示例代码(轨迹跟踪、过线 人数统计、目标热力图)
Ubuntu 22.04 搭建 yolov8 环境 运行示例代码(轨迹跟踪、过线 人数统计、目标热力图)
2024-08-27 19:36:53 1152
原创 win11成功点亮 WSL 创建的 Linux 子系统 jupyter服务 并配合 conda 环境运行代码【保姆级教程】
很早之前写了 远程访问阿里云服务器 jupyter 【保姆级教程】,今天又开始折腾我win11笔记本电脑的 WSL 开启的 linux 子系统啦远程访问阿里云服务器 jupyter 【保姆级教程】如何使用 WSL 在 Windows 上安装 Linux | VsCode 打开 WSL 子系统的代码。
2024-08-24 09:28:11 988
原创 LayoutLMv3 : 基于统一文本和带Masking图像的文档AI预训练【论文翻译】
LayoutLMv3 来为文档智能领域预训练多模态 Transformer 模型,重新设计了 LayoutLM 的模型架构和预训练目标。与文档智能领域现有的多模态模型不同,LayoutLMv3 不依赖于预训练的 CNN 或 Faster R-CNN 骨干来提取视觉特征,从而显著减少了参数数量并消除了区域注释的需求
2023-11-17 08:00:00 1541
原创 Benchmarking Chinese Text Recognition: Datasets, Baselines| OCR 中文数据集【论文翻译】
深度学习蓬勃发展的局面见证了近年来文本识别领域的迅速发展。然而,现有的文本识别方法主要针对英文文本。作为另一种广泛使用的语言,中文文本识别在各个领域都有广泛的应用市场。根据我们的观察,我们认为中文文本识别受到关注不足的原因在于缺乏合理的数据集构建标准、统一的评估协议以及现有基准结果。为了弥补这一空白,我们从公开的竞赛、项目和论文中手动收集了中文文本识别数据集。根据应用场景,我们将收集到的数据集分为场景、网络、文档和手写数据集四类。此外,我们在中文文本识别中规范了评估协议。
2023-08-31 12:39:12 1682
原创 SVTR: 使用单一视觉模型进行场景文本识别【论文翻译】
场景文本识别旨在将自然图像中的文本转录为数字字符序列,以传达对场景理解至关重要的高层语义信息。该任务具有挑战性,原因在于文本变形、字体、遮挡、杂乱背景等的变化。在过去的几年中,人们做出了许多努力来提高识别准确性。现代文本识别器除了准确性外,还考虑到了推理速度等因素,以满足实际需求。
2023-07-23 08:43:40 1222 2
原创 20分钟搞定 Stable Diffusion 模型在线服务部署
近期各个大厂的AI绘画产品也相继出炉,而对于个人使用者和喜欢尝鲜的开发者而言,最值得体验的两款AI绘画产品莫过于 Midjourney 和 Stable Diffusion;Midjourney 是一款商业AI绘画工具,借助于 Discord 服务平台快速普及,受到众多用户的追捧和喜爱;而 Stable Diffusion 则选择了走开源之路,并且在一些方面的出图潜力和Midjourney相比不相伯仲,受到广大开源爱好者的青睐。
2023-06-08 22:05:21 4899 47
原创 离开Pycharm就不会调式代码了?Python pdb调试了解一下
我们的深度学习 Python 代码在服务器中(很可能是黑窗口),无法安装开发工具(pycharm、VSCode),那么这时代码临时出了问题,该如何快速定位进行bug调试呢?这就是本文要和各位同学介绍的 Python(C++也有gdb调试)pdb 代码调试本文谨对 Python pdb 代码调试 基础常用步骤和命令 和大家做简单介绍哈。
2023-03-08 00:00:15 860 5
原创 时隔一年,终于还是对 YOLOX 之 Openvino 出手啦
YOLOX 系列时隔一年,终于还是对 YOLOX 之 Openvino 出手啦,本博主核心内容YOLOX pytorch、onnx、Openvino 环境搭建pytorch2onnx 模型转换、推理onnx2Openvino 模型转换、推理YOLOX (pytorch)模型转onnx转Openvino之运行推理【YOLOX 实战五】【一文读懂】
2022-10-03 13:35:48 3021 13
原创 模型训练前后显卡占用对比、多卡训练GPU占用分析【一文读懂】
本次博文简单记录,多卡训练任务中 ,各个 GPU 资源占用情况 ,内容较为基础,后续有新的心再继续补充:多卡训练任务中,主卡需要承担和其他卡之前的通信,可以看到 :实验一:0,1,2,3 四卡训练,0 号主卡多了 3个 通信 进程...
2022-08-02 07:00:00 2917 8
原创 开放域OOD主要数据集、评价指标汇总
in-distribution data (分布内训练数据集)、OOD test dataset (分布外测试数据集)Evaluation metrics. We evaluate the performance of OOD detection by measuring the following metrics
2022-07-27 21:13:08 3002 4
原创 细粒度识别、分类、检索数据集整理
细粒度相关研究中用到的主要数据集如下:Fine-grained visual classification (FGVC) 相关主要训练和测评数据集如下:CUB-200-2011、Standford Cars、FGVC-Aircraft
2022-06-25 11:07:04 1965 6
原创 image inpainting 还有哪些优化的点啊
这些 Trick 当然是有的,可问题是、如果这些 Trick 那么好实现、好验证你、我、或者其它卷到这个赛道的小伙伴、难道不会自己去实现、然后 水一篇SCI、实力 + 运气好 上波顶会 ?
2022-06-16 21:08:53 1408 8
原创 媒体领域AI能力测评,黑白图像上色、一键微笑哪家强
优秀的视频编辑服务,不仅能够记录我们现在的生活,还能够让我们穿越过去,和时空对话。随着近些年、AI着色、老照片还原、人脸表情编辑、视频清晰化等 AI 技术的飞速发展,各大厂商也相继提供了 AI开放平台 供用户和开发者体验使用。墨理就 华为、百度、阿里、字节、Adobe 等知名企业的 AI 相关技术(AI 着色、一键微笑) 的效果展开初步体验和评测 。...
2022-06-02 16:00:28 15238 12
原创 Ubuntu20安装并配置OpenVINO【图文教程】
Ubuntu20安装并配置OpenVINO【详细图文教程】,Install OpenVINO;随着AI技术等对应用开发和功能实现的影响越来越大,这也就要求相关企业具备更强的AI开发能力,从数据收集、数据预处理、数据标注、模型训练、模型评估和模型部署等一系列任务,无一不考验着企业的AI模型精度和AI推理速度、AI 算力资源等AI开发、落地能力。
2022-05-18 20:21:25 7329 13
原创 图像修复 : 基于条件纹理和结构并行生成的图像修复——ICCV 2021 【附测评源码】
图像修复ICCV 2021文章测评:代码简洁、很直观,没有注意到,论文是否提到 BaseLine ,不过感觉就是 似曾相识,可能是之前看的论文太多了, 网络结构、大体就是那样、变过来、变过去、细节决定 提升效果
2022-04-30 15:08:44 3456 25
原创 图像修复 : ICCV 2021 基于条件纹理和结构并行生成的图像修复【翻译】
为了增强全局一致性,设计了双向门控特征融合 (Bi-GFF) 模块来交换和组合结构和纹理信息,并开发了上下文特征聚合 (CFA) 模块来按区域细化生成的内容亲和力学习和多尺度特征聚合。在 CelebA、Paris StreetView 和 Places2 数据集上的定性和定量实验证明了所提出方法的优越性
2022-04-24 20:27:19 5667 3
原创 云原生容器技术之 Docker 常用命令 - 重点学习
云原生容器技术之 Docker、CentOS 安装 Docker 最新教程、Docker常用命令汇总
2022-04-17 21:51:52 1131
原创 云原生之 K8S 能够做什么
Kubernetes的名字来自希腊语,意思是“舵手” 或 “领航员”。K8s是将8个字母“ubernete”替换为“8”的缩写。Kubernetes 特点:可移植: 支持公有云,私有云,混合云,多重云(multi-cloud);可扩展: 模块化, 插件化, 可挂载, 可组合;自动化: 自动部署,自动重启,自动复制,自动伸缩/扩展
2022-04-15 21:24:39 428
原创 盲图像超分辨率重建 ( CVPR,2022) (Pytorch)(附代码)
基于噪声和核函数的精细退化盲图像超分辨率重建,这篇测评文章用心写了一个下午,个人觉得作为一个初学者入门教程,再合适不过了,敬请查阅
2022-04-07 14:34:46 13154 31
原创 图像修复:专栏博文推荐查阅顺序
图像修复、专栏目录:推荐查阅顺序,如果有刚刚开始做深度学习,对深度学习 Cuda、Pytorch 相关环境高效搭建,还不是非常清楚的小伙伴建议参考我的这篇博文、折腾清楚这些基础知识、相信能够为大家节约难以估计的学习成本
2022-04-02 17:12:35 4772 2
原创 如何写一篇综述论文、浅谈
一、综述不是什么?综述不是 research paper,在写研究性文章的时候,我们是有自己的结果和贡献的,你是抛出了一个新的讨论点。
2022-03-31 17:22:35 10813 9
原创 如何选到一位靠谱的研究生导师
有师弟在知乎找到我、和我咨询一下选导师的事情,导师真实能力、习性相关信息,最快速的获取渠道:同实验室在读的研二、研三硕士生
2022-03-21 14:34:21 1282 2
原创 实时低亮度图像修复:CVPR 2021
详细测评教程:CVPR 2021,实时恢复极暗的图像从而改进目标检测,图像修复新的一种研究创作思路
2022-03-15 10:57:21 7564 11
原创 如何相对高效解决代码测评、训练过程中遇到的 Bug
图像修复、专栏目录:推荐查阅顺序,如果有刚刚开始做深度学习,对深度学习 Cuda、Pytorch 相关环境高效搭建,还不是非常清楚的小伙伴建议参考我的这篇博文、折腾清楚这些基础知识、相信能够为大家节约难以估计的学习成本???? 模型训练到模型部署基础环境搭建推荐博文查阅顺序——【1024专刊】重点参考,如下图所示部分相关博文即可,相信能够有效帮到大家理解环境搭建这个过程????
2022-03-04 18:52:34 2945 6
原创 超分重建:基础问答汇总
在与数百位 AI 领域小伙伴同学,交流探讨的过程中、文章目录基础问答汇总博主简介GPU 服务器显卡讨论跨专业到深度学习、如何入门一点认可多读顶会、多总结自己的笔记心得、为什么论文里面的指标你训练时很难复现、订阅你的专栏、可以提供指导吗?一本正经的学术探讨、确实不太适合我、总结过去两年写作方面的心路历程
2022-02-28 11:00:21 3305 13
原创 2022预计要火的视觉语言理解和生成:一键生成图像标注,视觉问答,代码开源,官方 Demo 可玩
一键生成图像标注,视觉问答,代码开源,官方 Demo 可玩、一线 AI 资讯速递
2022-02-11 15:51:08 5400 14
原创 一文读懂CentOS 8 安装JDK 11:配置JAVA_HOME环境变量
一文读懂CentOS 8 安装JDK 11:配置JAVA_HOME环境变量、Linux服务器JDK安装
2022-01-26 10:37:16 6987 15
原创 AI 之路、回顾 2021,展望 2022 :当代青年的小烦恼
大学、硕士、在家呆着呆着、一不留神、就毕业了、至于博士:恭喜你、导师说师兄表现不错、能力很强、留他再读一年
2022-01-21 17:15:08 3669 10
原创 CVPR 2021、多样化图像修复、示例测试教程、附源码
该网络能够生成具有高度多样性的合理结构、CVPR 2021: "Generating Diverse Structure for Image Inpainting With Hierarchical VQ-VAE" 测试教程
2022-01-12 09:48:02 3187 11
原创 yolov3 darknet 转 TVM 推理输出、一文读懂
yolov3 darknet 转 TVM Python 推理,附仓库可运行代码;该代码支持 YOLO-V2 and YOLO-V3 DarkNet Models 转 TVM 推理输出;1. 模型下载【代码自动下载、网速不佳、也可手动下载】2. 模型转换【DarkNet Models 转 TVM 】3. 模型推理【TVM 推理示例】
2022-01-08 10:12:39 6248 5
原创 用自己的云服务器来学会OpenCV炫酷使用、深度学习需要热爱、博客之星我来了
直接上干货、记录此次用自己的云服务器来开启一个深度学习环境搭建初体验、为下一步的 OpenCV炫酷展示打好基础、作为全网 AI 领域 干货最多的博主之一,不负光阴不负卿
2021-12-28 11:07:28 10052 25
原创 LaTeX2021 公式编写、图文安装、详细教程、一文读懂
论文投递时、我们期待 【大修、小修、弱接收、接收、强烈接收、都在承受范围到惊喜之列】,想必这是无数内卷在学术道路上的各位小伙伴、最最期待、念念不忘的一个声音
2021-12-24 15:15:38 1871 7
深度学习自学之路精简版PDF_墨理学AI_CSDN_博客砖家_创作出品
2022-03-31
U2Net-master.zip
2020-11-30
口罩检测带标签数据集样本
2020-11-25
maskSet4k.zip
2020-11-24
不规则mask图像修复论文+数据分享
2020-11-20
超分重建PSNR和SSIM计算--pytorch.zip
2020-11-13
PEN-Net.zip
2020-11-09
DRN-SR.zip
2020-11-04
Irregular Mask Dataset 部分测试 mask
2020-09-17
超分测试数据集-2、3、4、8倍重建
2020-08-08
单通道16k-16bit wav中英文数据样本.zip
2020-04-13
单通道16k-16bit音频和双通道8k-16bit音频
2018-11-13
Django-Ubuntu开发教程
2018-08-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人