论文代码研读
文章平均质量分 89
Patrick Star1
我对任何唾手可得,快速,出自本能,即兴,含混的事物没有信心。我相信缓慢,平和,细水长流的力量,踏实,冷静。我不相信缺乏自律精神和不自我建设,不努力,可以得到个人或集体的解放。
展开
-
【零基础讲论文源码】CVT:Introducing Convolutions to Vision Transformers
目前这个系列会开两个方向, cv transformer 和OCR方向。Transformer方向 swin-transformer解读【链接】 CVT 解读【链接】 待续。。。OCR方向 DBnet解读【链接】(正在制作中。。。) PP_OCR【链接】(待续。。。) 待续。。。整体介绍:CvT: Introducing Convolutions to Vision Transformers,刚发不久的一篇文章,最近Transformer很多,之所有现在选这一篇是因为方法简洁高效原创 2021-04-27 20:13:27 · 5864 阅读 · 9 评论 -
【零基础讲论文源码】Swin-Transformer源代码阅读
Swin-transformer是微软 CVPR2021今年最近一篇非常棒的论文。Github【源代码地址】原文地址【地址】先上个结构图:(为方便阅读,代码进行简化)SwinTransformer: 主代码#整体结构中,通过PatchEmbed()分割出图像块,再经过相应层数的BasicLayer()。class SwinTransformer(nn.Module): def __init__(): super().__init__() # spl原创 2021-04-13 19:59:46 · 7587 阅读 · 7 评论 -
【场景文本检测】paper里的实验参数和数据集选择
常用的数据集名称训练集验证集测试集特点ICDAR 2013ICDAR 20151000——500ICDAR 2017 MLT720018009000Total-Text1255——300CTW15001000——500...原创 2020-03-10 22:25:30 · 630 阅读 · 1 评论 -
CTPN代码研读(二) utils/prepare(label)研读
知识点:#其实sys.path是一个列表,这个列表内的路径都添加到环境变量中去了。#sys.path.append()方法可以添加自定义的路径。#os.getcwd(): 返回当前目录#os.listdir() 返回指定的文件夹包含的文件或文件夹的名字的列表。#os.path.join()函数用于路径拼接文件路径。#os.path.split()返回文件的路径和文件名#os.pat...原创 2019-05-06 21:09:06 · 1154 阅读 · 0 评论 -
CTPN代码研读(三)utils/dataset(data_provider)研读
CTPN代码研读系列:数据集的使用以及模型prepare/labelprepare/data_provider知识点:python–multiprocessing包简单介绍:http://www.cnblogs.com/tkqasn/p/5701230.html原创 2019-05-11 11:27:24 · 1313 阅读 · 6 评论 -
CTPN代码研读(一)数据集的使用以及模型
CTPN代码研读系列:数据集的使用以及模型1.输入的数据集标签gt_img_859.txt数据集格式:从左到右,分别为 x1,y1,x2,y2,x3,y3,x4,y4(四个检测框的x,y坐标),语种,识别出的字符 1192,1862,2424,1895,2405,2428,1185,2366,english,8512846,1280,1092,1379,1088,147...原创 2019-05-11 11:32:41 · 3593 阅读 · 16 评论 -
CTPN代码研读(四)utils/rpn_msr(bbox)研读
note:两个程序是用Cython写的,好处是速度快,但因为要用到cython涉及编译问题,所以编译比较麻烦。在作者的issue里找到了对应的py文件,作为参看。这两个nms.py和bbox.py是一个通用的,大部分的代码上都是相同的。先附上对应代码:#the py for nmsimport numpy as npdef nms(dets, thresh): x1 = dets[...原创 2019-07-09 11:26:37 · 626 阅读 · 0 评论 -
【代码研读】Mask RCNN代码阅读笔记(一)总览篇
前言:mask-rcnn作为如今领域流行的代码框架,被广泛应用,为了学习的需要,结合网上的教程,写了以下的代码研读笔记阅读的代码为:mask-rcnn benchmark【github地址】整体架构:mask-rcnn核心代码方面主要分为三个部分:backbone(骨架特征提取网络)+rpn(粗分类的区域提议网络)+roi_head(实现各部分功能的集成模块,如mask/detct...原创 2019-10-08 18:36:33 · 761 阅读 · 0 评论 -
【代码研读】Mask RCNN代码阅读笔记(二)骨架网络backbone和入口
前言笔记分为三个部分,backbone,rpn,roi_head三个部分,之前的项目总览见【链接】。本文主要是讲解backbone部分的文件,通过在总体把握和实现细节两个方面对其进行记录。│ │ ├── detector│ │ │ ├── detectors.py #检测的代码入口│ │ │ ├── generalized_rcnn.py #生成各种组合的...原创 2019-10-09 15:47:23 · 2247 阅读 · 0 评论