专注于AI领域前沿技术学习与分享：目标检测、图像修复、超分重建、AI工程化

博主 V 信 : bravePatch，添加请注明来意；作为全网 AI 领域干货最多的博主之一，不负光阴不负卿

原创 LayoutLMv3 ：基于统一文本和带Masking图像的文档AI预训练【论文翻译】

LayoutLMv3 来为文档智能领域预训练多模态 Transformer 模型，重新设计了 LayoutLM 的模型架构和预训练目标。与文档智能领域现有的多模态模型不同，LayoutLMv3 不依赖于预训练的 CNN 或 Faster R-CNN 骨干来提取视觉特征，从而显著减少了参数数量并消除了区域注释的需求

2023-11-17 08:00:00 1182

原创 LayoutLMv2:多模态预训练用于富含视觉元素的文档理解【论文翻译】

LayoutLMv2（Xu等，2020）。与传统的LayoutLM模型不同，其中视觉嵌入是在微调阶段合并的，LayoutLMv2在预训练阶段通过利用Transformer架构来整合视觉信息，从而学习视觉和文本信息之间的跨模态交互。

2023-09-27 09:24:10 531

原创 LayoutLM【论文翻译】

在单个框架中联合学习文本和布局信息。它在多个下游任务中实现了新的最先进结果，包括表单理解（从70.72提高到79.27）、收据理解（从94.02提高到95.24）和文档图像分类（从93.07提高到94.42）

2023-09-12 09:28:37 446 2

原创 Benchmarking Chinese Text Recognition: Datasets, Baselines| OCR 中文数据集【论文翻译】

深度学习蓬勃发展的局面见证了近年来文本识别领域的迅速发展。然而，现有的文本识别方法主要针对英文文本。作为另一种广泛使用的语言，中文文本识别在各个领域都有广泛的应用市场。根据我们的观察，我们认为中文文本识别受到关注不足的原因在于缺乏合理的数据集构建标准、统一的评估协议以及现有基准结果。为了弥补这一空白，我们从公开的竞赛、项目和论文中手动收集了中文文本识别数据集。根据应用场景，我们将收集到的数据集分为场景、网络、文档和手写数据集四类。此外，我们在中文文本识别中规范了评估协议。

2023-08-31 12:39:12 1540

原创 SVTR: 使用单一视觉模型进行场景文本识别【论文翻译】

场景文本识别旨在将自然图像中的文本转录为数字字符序列，以传达对场景理解至关重要的高层语义信息。该任务具有挑战性，原因在于文本变形、字体、遮挡、杂乱背景等的变化。在过去的几年中，人们做出了许多努力来提高识别准确性。现代文本识别器除了准确性外，还考虑到了推理速度等因素，以满足实际需求。

2023-07-23 08:43:40 649 2

原创 open-mmlab/mmocr 环境搭建、推理和训练入门教程【一】

open-mmlab/mmocr 环境搭建、推理和训练入门教程

2023-06-26 17:03:04 1189 6

原创 20分钟搞定 Stable Diffusion 模型在线服务部署

近期各个大厂的AI绘画产品也相继出炉，而对于个人使用者和喜欢尝鲜的开发者而言，最值得体验的两款AI绘画产品莫过于 Midjourney 和 Stable Diffusion；Midjourney 是一款商业AI绘画工具，借助于 Discord 服务平台快速普及，受到众多用户的追捧和喜爱；而 Stable Diffusion 则选择了走开源之路，并且在一些方面的出图潜力和Midjourney相比不相伯仲，受到广大开源爱好者的青睐。

2023-06-08 22:05:21 4510 47

原创离开Pycharm就不会调式代码了？Python pdb调试了解一下

aha，今天 3月7号，女生节、明天 3 月 8号啦，在此，谨祝各位读者朋友、女同学们节日快乐需求如下：我们的深度学习 Python 代码在服务器中（很可能是黑窗口），无法安装开发工具（pycharm、VSCode），那么这时代码临时出了问题，该如何快速定位进行bug调试呢？这就是本文要和各位同学介绍的 Python（C++也有gdb调试）pdb 代码调试本文谨对 Python pdb 代码调试基础常用步骤和命令和大家做简单介绍哈。

2023-03-08 00:00:15 684 5

原创时隔一年，终于还是对 YOLOX 之 Openvino 出手啦

YOLOX 系列时隔一年，终于还是对 YOLOX 之 Openvino 出手啦，本博主核心内容YOLOX pytorch、onnx、Openvino 环境搭建pytorch2onnx 模型转换、推理onnx2Openvino 模型转换、推理YOLOX （pytorch）模型转onnx转Openvino之运行推理【YOLOX 实战五】【一文读懂】

2022-10-03 13:35:48 2828 13

原创模型训练前后显卡占用对比、多卡训练GPU占用分析【一文读懂】

本次博文简单记录，多卡训练任务中，各个 GPU 资源占用情况，内容较为基础，后续有新的心再继续补充：多卡训练任务中，主卡需要承担和其他卡之前的通信，可以看到：实验一：0，1，2，3 四卡训练，0 号主卡多了 3个通信进程...

2022-08-02 07:00:00 2716 9

原创开放域OOD主要数据集、评价指标汇总

in-distribution data (分布内训练数据集)、OOD test dataset （分布外测试数据集）Evaluation metrics. We evaluate the performance of OOD detection by measuring the following metrics

2022-07-27 21:13:08 2550 4

原创细粒度识别、分类、检索数据集整理

细粒度相关研究中用到的主要数据集如下：Fine-grained visual classification (FGVC) 相关主要训练和测评数据集如下：CUB-200-2011、Standford Cars、FGVC-Aircraft

2022-06-25 11:07:04 1850 6

原创 image inpainting 还有哪些优化的点啊

这些 Trick 当然是有的，可问题是、如果这些 Trick 那么好实现、好验证你、我、或者其它卷到这个赛道的小伙伴、难道不会自己去实现、然后水一篇SCI、实力 + 运气好上波顶会？

2022-06-16 21:08:53 1368 8

原创媒体领域AI能力测评，黑白图像上色、一键微笑哪家强

优秀的视频编辑服务，不仅能够记录我们现在的生活，还能够让我们穿越过去，和时空对话。随着近些年、AI着色、老照片还原、人脸表情编辑、视频清晰化等 AI 技术的飞速发展，各大厂商也相继提供了 AI开放平台供用户和开发者体验使用。墨理就华为、百度、阿里、字节、Adobe 等知名企业的 AI 相关技术（AI 着色、一键微笑）的效果展开初步体验和评测。...

2022-06-02 16:00:28 15156 12

原创 Ubuntu20安装并配置OpenVINO【图文教程】

Ubuntu20安装并配置OpenVINO【详细图文教程】，Install OpenVINO；随着AI技术等对应用开发和功能实现的影响越来越大，这也就要求相关企业具备更强的AI开发能力，从数据收集、数据预处理、数据标注、模型训练、模型评估和模型部署等一系列任务，无一不考验着企业的AI模型精度和AI推理速度、AI 算力资源等AI开发、落地能力。

2022-05-18 20:21:25 6318 13

原创图像修复 : 基于条件纹理和结构并行生成的图像修复——ICCV 2021 【附测评源码】

图像修复ICCV 2021文章测评：代码简洁、很直观,没有注意到，论文是否提到 BaseLine ，不过感觉就是似曾相识，可能是之前看的论文太多了, 网络结构、大体就是那样、变过来、变过去、细节决定提升效果

2022-04-30 15:08:44 3367 25

原创图像修复 : ICCV 2021 基于条件纹理和结构并行生成的图像修复【翻译】

为了增强全局一致性，设计了双向门控特征融合 (Bi-GFF) 模块来交换和组合结构和纹理信息，并开发了上下文特征聚合 (CFA) 模块来按区域细化生成的内容亲和力学习和多尺度特征聚合。在 CelebA、Paris StreetView 和 Places2 数据集上的定性和定量实验证明了所提出方法的优越性

2022-04-24 20:27:19 5208 3

原创云原生容器技术之 Docker 常用命令

云原生容器技术之 Docker、CentOS 安装 Docker 最新教程、Docker常用命令汇总

2022-04-17 21:51:52 1051

原创云原生之 K8S 能够做什么

Kubernetes的名字来自希腊语，意思是“舵手” 或 “领航员”。K8s是将8个字母“ubernete”替换为“8”的缩写。Kubernetes 特点：可移植: 支持公有云，私有云，混合云，多重云（multi-cloud）；可扩展: 模块化, 插件化, 可挂载, 可组合；自动化: 自动部署，自动重启，自动复制，自动伸缩/扩展

2022-04-15 21:24:39 401

原创盲图像超分辨率重建 ( CVPR，2022) (Pytorch)（附代码）

基于噪声和核函数的精细退化盲图像超分辨率重建，这篇测评文章用心写了一个下午，个人觉得作为一个初学者入门教程，再合适不过了，敬请查阅

2022-04-07 14:34:46 12630 31

原创图像修复：专栏博文推荐查阅顺序

图像修复、专栏目录：推荐查阅顺序，如果有刚刚开始做深度学习，对深度学习 Cuda、Pytorch 相关环境高效搭建，还不是非常清楚的小伙伴建议参考我的这篇博文、折腾清楚这些基础知识、相信能够为大家节约难以估计的学习成本

2022-04-02 17:12:35 4709 2

原创如何写一篇综述论文、浅谈

一、综述不是什么？综述不是 research paper，在写研究性文章的时候，我们是有自己的结果和贡献的，你是抛出了一个新的讨论点。

2022-03-31 17:22:35 6810 5

原创 tensorflow安装测试教程【一文读懂】

tensorflow 各个版本安装体验教程、一文读懂

2022-03-24 17:42:05 6221 9

原创如何选到一位靠谱的研究生导师

有师弟在知乎找到我、和我咨询一下选导师的事情，导师真实能力、习性相关信息，最快速的获取渠道：同实验室在读的研二、研三硕士生

2022-03-21 14:34:21 1226 2

原创实时低亮度图像修复：CVPR 2021

详细测评教程：CVPR 2021，实时恢复极暗的图像从而改进目标检测，图像修复新的一种研究创作思路

2022-03-15 10:57:21 7511 11

原创如何相对高效解决代码测评、训练过程中遇到的 Bug

图像修复、专栏目录：推荐查阅顺序，如果有刚刚开始做深度学习，对深度学习 Cuda、Pytorch 相关环境高效搭建，还不是非常清楚的小伙伴建议参考我的这篇博文、折腾清楚这些基础知识、相信能够为大家节约难以估计的学习成本???? 模型训练到模型部署基础环境搭建推荐博文查阅顺序——【1024专刊】重点参考，如下图所示部分相关博文即可，相信能够有效帮到大家理解环境搭建这个过程????

2022-03-04 18:52:34 2919 6

原创超分重建：基础问答汇总

在与数百位 AI 领域小伙伴同学，交流探讨的过程中、文章目录基础问答汇总博主简介GPU 服务器显卡讨论跨专业到深度学习、如何入门一点认可多读顶会、多总结自己的笔记心得、为什么论文里面的指标你训练时很难复现、订阅你的专栏、可以提供指导吗？一本正经的学术探讨、确实不太适合我、总结过去两年写作方面的心路历程

2022-02-28 11:00:21 3266 13

原创图像修复：人类的悲欢并不相通

人类的悲欢并不相通,世间皆苦悲喜自渡；不为模糊不清的未来担忧,只为清清楚楚的现在努力；

2022-02-17 12:25:10 1763 12

原创 2022预计要火的视觉语言理解和生成：一键生成图像标注，视觉问答，代码开源，官方 Demo 可玩

一键生成图像标注，视觉问答，代码开源，官方 Demo 可玩、一线 AI 资讯速递

2022-02-11 15:51:08 5350 14

原创一文读懂CentOS 8 安装JDK 11：配置JAVA_HOME环境变量

一文读懂CentOS 8 安装JDK 11：配置JAVA_HOME环境变量、Linux服务器JDK安装

2022-01-26 10:37:16 6783 15

原创 AI 之路、回顾 2021，展望 2022 ：当代青年的小烦恼

大学、硕士、在家呆着呆着、一不留神、就毕业了、至于博士：恭喜你、导师说师兄表现不错、能力很强、留他再读一年

2022-01-21 17:15:08 3635 10

原创 CVPR 2021、多样化图像修复、示例测试教程、附源码

该网络能够生成具有高度多样性的合理结构、CVPR 2021: "Generating Diverse Structure for Image Inpainting With Hierarchical VQ-VAE" 测试教程

2022-01-12 09:48:02 3136 11

原创 yolov3 darknet 转 TVM 推理输出、一文读懂

yolov3 darknet 转 TVM Python 推理，附仓库可运行代码；该代码支持 YOLO-V2 and YOLO-V3 DarkNet Models 转 TVM 推理输出；1. 模型下载【代码自动下载、网速不佳、也可手动下载】2. 模型转换【DarkNet Models 转 TVM 】3. 模型推理【TVM 推理示例】

2022-01-08 10:12:39 6179 5

原创我的C站万粉成长之路、2021 笔耕不辍

人生如逆旅，我亦是行人，我的C站万粉成长之路、2021年笔耕不辍

2022-01-04 11:54:14 1896 28

原创用自己的云服务器来学会OpenCV炫酷使用、深度学习需要热爱、博客之星我来了

直接上干货、记录此次用自己的云服务器来开启一个深度学习环境搭建初体验、为下一步的 OpenCV炫酷展示打好基础、作为全网 AI 领域干货最多的博主之一，不负光阴不负卿

2021-12-28 11:07:28 9929 25

原创 LaTeX2021 公式编写、图文安装、详细教程、一文读懂

论文投递时、我们期待【大修、小修、弱接收、接收、强烈接收、都在承受范围到惊喜之列】，想必这是无数内卷在学术道路上的各位小伙伴、最最期待、念念不忘的一个声音

2021-12-24 15:15:38 1641 7

原创论文撰写八大技巧与八大心得，一文读懂

帮老板审了不少Paper，总结一些心得分享给各位正在路上的小可爱们；写论文的目的是为了发表，发表论文就需要按照论文的套路来写，不然审稿人就会以“不专业”的理由拒稿。辛辛苦苦做出来的科研成果，因为没有按照套路而被拒，这或许是最痛苦的事情。

2021-12-10 10:15:00 9475 24

原创优秀开源产品推荐：Ncnn —— GitHub上不去的小伙伴舒服了

优秀开源产品推荐：Ncnn；C站开源代码库丰富起来，GitHub上不去的小伙伴舒服了；高性能神经网络推理框架 ncnn 快速学习有效教程推荐；

2021-12-06 15:49:59 4965 20

原创一文读懂非root用户正确编译安装 protobuf —— 附 CMakeLists.txt 配置

❤️ 本文带大家有效解决 C++ 工程中正确编译安装和使用 protobuf???? 总之，这篇博文写了很久，笔者认为它很强，建议直接三连、评论区见

2021-12-02 18:02:05 3264 19

原创一文读懂 Linux 服务器 JDK1.8 和 GCC 7.5 解压、编译安装、环境变量配置 —— Just for 当前用户

为什么要给自己的用户安装 JDK 呢；昂，在生产中，如果一台服务器不止你一个人在用，那么你就会懂得，很多环境和库只自己安装自己用，真的能够解决很多问题

2021-11-26 14:39:33 4695 12

深度学习自学之路精简版PDF_墨理学AI_CSDN_博客砖家_创作出品

内容概要：深度学习入门博文整理、包含Cuda安装、Pytorch 安装、Tensorflow安装、VScode使用、虚拟机安装、基础环境搭建、计算机视觉领域实战教程：超分重建、图像修复、风格迁移、目标检测、PDF 电子版1.0；适合人群：适合刚刚跨入AI领域不久的新同学查阅自学，代码实战趣学教程；使用场景：适合具备一定自学能力、基础文档查阅、喜欢代码实战的学习方式；阅读建议：跟着系列博文进行学习、能够大家节约相当多学习的时间成本备注说明：该排除的坑墨理已经帮各位小伙伴排过了，欢迎各位小伙伴下载、查阅、分享；博主主页：https://blog.csdn.net/sinat_28442665/category_9054713.html

2022-03-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

深度学习自学之路精简版PDF_墨理学AI_CSDN_博客砖家_创作出品

U2Net-master.zip

不规则mask数据集.zip

口罩检测带标签数据集样本

maskSet4k.zip

不规则mask图像修复论文+数据分享

超分重建PSNR和SSIM计算--pytorch.zip

PEN-Net.zip

DRN-SR.zip

Irregular Mask Dataset 部分测试 mask

超分测试数据集-2、3、4、8倍重建

单通道16k-16bit wav中英文数据样本.zip

matlabPyrTools-master.zip

手写体数据和KNN实现代码.zip

单通道16k-16bit音频和双通道8k-16bit音频

VC6.0 C++

Dev-Cpp+5.4.0

Django-Ubuntu开发教程

Lingo8.0手册

图像转换2020论文.zip

空空如也