- 博客(98)
- 收藏
- 关注
原创 【ICCV2023】 MRN:一种多路复用路由网络的增量多语言文本识别方法
ICCV 2023 MRN: Multiplexed Routing Network for Incremental Multilingual Text Recognition
2023-07-25 01:10:11 352
原创 【文本识别系列】Show, Attend and Read: A Simple and Strong Baseline for Irregular Text Recognition
论文原文:【链接】解读代码:【链接】
2021-07-15 18:55:59 1136 1
原创 【OCR文本识别系列】Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Tex
read like humans 是中科大在2021年发在CVPR上的论文论文链接 【链接】代码链接【链接】视觉模型class BaseVision(Model): def __init__(self, config): super().__init__(config) if config.model_vision_backbone == 'transformer': self.backbone = ResTranformer(
2021-07-06 15:50:36 1213
原创 【零基础讲论文源码】gMLP:Pay Attention to MLPs
Transformer方向 swin-transformer解读【链接】 CVT 解读【链接】 gMLP解读【链接】gMLP是一种使用MLP来获得transformer性能的方法,谷歌用更少的参数在大量实验上达到了transformer同样的精度。gMLP的论文地址【链接】讲解的代码地址【链接】gMLP结构class gMLP(nn.Module): def __init__( self, *, ...
2021-05-31 16:39:55 2862
原创 【零基础讲论文源码】CVT:Introducing Convolutions to Vision Transformers
目前这个系列会开两个方向, cv transformer 和OCR方向。Transformer方向 swin-transformer解读【链接】 CVT 解读【链接】 待续。。。OCR方向 DBnet解读【链接】(正在制作中。。。) PP_OCR【链接】(待续。。。) 待续。。。整体介绍:CvT: Introducing Convolutions to Vision Transformers,刚发不久的一篇文章,最近Transformer很多,之所有现在选这一篇是因为方法简洁高效
2021-04-27 20:13:27 6100 9
原创 【零基础讲论文源码】Swin-Transformer源代码阅读
Swin-transformer是微软 CVPR2021今年最近一篇非常棒的论文。Github【源代码地址】原文地址【地址】先上个结构图:(为方便阅读,代码进行简化)SwinTransformer: 主代码#整体结构中,通过PatchEmbed()分割出图像块,再经过相应层数的BasicLayer()。class SwinTransformer(nn.Module): def __init__(): super().__init__() # spl
2021-04-13 19:59:46 7813 7
原创 【保研面试】线性代数面试复习
线性相关和无关有向量组A,a1,a2…an , 如果存在不是全为0的k1,k2…kn,满足a1 * k1 + a2 * k2… an * kn = 0则向量组A称为线性相关(可以跟向量组A共面联系,即可以通过几个向量,表示出另外几个向量,故称为线性相关)极大线性无关组设有向量组A a1,a2…an(本身为线性相关) :若选出r个向量,满足以下条件(1)向量组 r : 线性无关;(2) 向量组A中任意r+1个向量(若有的话)都线性相关,则向量组r 是向量组A的一个极大线性无关组(简称为
2020-08-26 20:48:42 5494
原创 【清华大学软院】15-19年推免试题历年整理
整理的题目为清软预推免机试(外校)硕士机考题目。年代题目1题目2题目32019质因数分解二叉搜索树区间DP(折叠字符串)2018日期转换高精度模拟区间DP(戳气球)2017进制素数被遗漏的数字DP(收集苹果)2016大数运算DPDFS2015进制素数: http://acm.hdu.edu.cn/showproblem.php?pid=12302017年题目(这个是找的最准确的题目):1题见【链接】2题见【链接】
2020-08-22 19:12:25 1807 1
原创 【清华软院机试】2019年预推免机试及题解
题目来自这位博主的回忆【链接】文章目录题目分类:1.质因数分解2.二叉树算权3.折叠字串题目分类: 质因数分解:简单模拟 二叉树找权:DFS+建树 折叠字串 : 区间DP(即使每年考区间DP,但也很难。。。)1.质因数分解质因数分解。给一个n,小于1亿,输出它的从小到大的质因数。如:输入6,输出2*3题解:由于找不到原题,只能根据回忆去解,找不到什么感觉比较难的点。#include<cstdio>#include<iostream>#include&l
2020-08-22 19:04:03 2224 1
原创 【清华软院机试】2018年预推免机试及题解
题目来自这位博主的回忆【链接】已知某世界时间为以下进制:100秒1分钟100分钟1小时10小时1天100天1个月10个月1年且人类的1天=该世界1天(这个条件巨坑,一小时没看到QAQ)输入人类世界的一天,格式如下:h: m:s d.m.y其中2000<=y<=50000输出某世界对应的时间,格式如下:h: m:s d.m.y其中人类世界的0:0:0 1.1.2000是某世界的0:0:0 1.1.0第二题:求2p−1的位数和最后500位结果,保留前导010
2020-08-21 20:51:52 1573 4
原创 【清华软院机试】2017年预推免机试及题解
题目分类 火星进位:高精度加法 被遗漏的数字:DFS+模拟 收集苹果:区间DP1.火星进位Sample Input1,0 2,14,2,0 1,2,01 10,6,4,2,10 0Sample Output1,0,11,1,1,01,0,0,0,0,0题解:模拟题写起来比较麻烦,建议看杭电佬的题解。这是一道类似高精度加法的问题,需要注意字符串读取的时候,多位的处理,以及高精度加法的模板熟悉程度。题目原地址【链接】#include<cstdio>#i
2020-08-18 15:07:55 1186
原创 【清华软院机试】2016年预推免机试及题解
文章目录题目分类:1.高精度立方2.最短路径3.四则运算问题题目分类: 1.高精度运算 2.最短路径 3.DFS模拟1.高精度立方从控制台输入一个合法数字,打印其立方• 例如• 输入123456789• 输出1881676371789154860897069• 基本编码能力、消耗时间题解:先进行计算,第二步处理进位问题。为方便进位操作,高精度存储时低位在前,高位在后。高精度乘法:1.i位与j位相乘,数字会放在i+j位置上。 2.处理每一位的进位问题。模板见:【链接】加法:
2020-08-14 15:22:40 785 3
原创 【清华软院机试】2015年预推免机试题及题解
2015年题目收集来自这位博主的专栏【链接】代码本身比博主的较为精简,更易初学者读懂。后期会更新其他几年题目文章目录题目1:病毒感染题目2:找到算式题目3:航线交叉2015 题目1:题目1:病毒感染需要注意当为4时,需要直接向外扩展;并且为防止遍历过程中,感染周围的人也被重复计算,我这里是通过给队列,在遍历之后,在进行感染操作。判断时为上一阶段的条件,即之前为3即可感染,之前为5即可治疗。(也可以考虑先状态++,再进行相应的判断)#include<cstdio>#include
2020-08-13 11:21:48 1017
原创 【项目实践】应用于医疗的相似度算法设计
算起来有段时间没写博客了,最近在整夏令营的事,随着夏令营告一段落,后面也需要给自己多多充电,顺便把浙大软院我做的项目放上来。代码放github上项目要求设计一个算法比较2张图片的计算相似度,在文档例子里面都是一对对的相识图片相识度设计为(0-1), 给出2张图片是相识的,相识度取向1。否者取向0;可以开发有界面的,也可以是命令行。代码一共分为4个文件,和一个主函数img_aug.py: 图像增强(包含二值化,图像的膨胀腐蚀,开闭运算,骨骼提取等)image_similarity.py :
2020-07-26 15:49:47 306
原创 【PAT甲级】1095Cars on Campus笔记及知识点
题目大意:给出n个⻋牌号、时间点、进出状态的记录,然后查询k个时间点这时校园内的⻋辆个数。最后还要输出在校园⾥⾯呆的时间最⻓的⻋的⻋牌号,以及呆了多久的时间。如果有多辆⻋就按照它的字⺟从⼩到⼤输出⻋牌知识点笔记vectorvector <string> v;for(int i=0;i!=v.end();i++)这种类型是不支持的,因为i和vector的类型不同,v...
2020-04-05 11:26:39 228
原创 【场景文本检测】paper里的实验参数和数据集选择
常用的数据集名称训练集验证集测试集特点ICDAR 2013ICDAR 20151000——500ICDAR 2017 MLT720018009000Total-Text1255——300CTW15001000——500...
2020-03-10 22:25:30 689 1
原创 【PAT甲级笔记】图类型题及题解
tips:强连通分量的dfs题目1013 Battle Over Cities (25分)It is vitally important to have all the cities connected by highways in a war. If a city is occupied by the enemy, all the highways from/toward that city...
2020-03-10 22:25:00 257
原创 【PAT甲级笔记】STL里的常用结构和函数
sort函数:可以给结构体,向量,列表等进行排序参数为(首地址,首地址+元素个数,cmp)cmp可以自定义给对应的比较函数,默认为升序,要想该如下://改成降序仅需要如下代码,sort(a[0],a[0]+10,cmp)bool cmp(int a,int b){ return a>b;}...
2020-03-10 22:24:45 506
原创 【PAT甲级笔记】二叉树树题型解法及对应题解
对应的专业英语词汇单词意思even number偶数positive正数postorder traversal后序遍历inorder traversal中序遍历level order traversal层序遍历
2020-02-06 09:51:31 389
原创 【PAT甲级笔记】树的题型以及对应解法
1053. Path of Equal Weight (30)tip: sort排序的时候,对父节点排序…#include<cstdio>#include<algorithm>#include<vector>using namespace std;struct Node{ int w; vector<int> chi...
2020-02-06 09:51:25 233
原创 【深度学习笔记】NMS代码学习
1. nms算法步骤如下:nms算法的总体流程为:for object in all objects: (1) 获取当前目标类别下所有bbx的信息 (2) 将bbx按照confidence从高到低排序,并记录当前confidence最大的bbx (3) 计算最大confidence对应的bbx与剩下所有的bbx的IOU,移除所有大于IOU阈值的bbx (4) 对剩下的bbx,循环执行(...
2020-01-28 20:17:03 659
原创 【PAT甲级笔记】别人经验总结和整理
时间有限,针对PAT考试,花了一点时间整理了一下学习内容:【推荐资源】1.柳神按题型整理的PAT甲级【链接】2.个人觉得不错的网站’【链接】2.甲级刷题索引【1】3.甲级刷题资源【2】考试考纲:理解并熟练编程实现经典高级算法,包括哈希映射、并查集、最短路径、拓扑排序、关键路径、贪心、深度优先搜索、广度优先搜索、回溯剪枝等;哈希映射:一般会用map和unordered_map就好。此...
2020-01-25 20:47:17 1098
原创 【PAT甲级笔记】001---Dijkstra算法类型题解
决定刷PAT,已经有一段时间,因为各种事情耽搁,就没能空下来,当发现是最后一次必须报名的时候,只有一个月的时间了…索性还不算太晚,这里整一下别人的PAT资源和自己的目录。【推荐资源】1.柳婼的博客【链接】2.甲级刷题索引【1】3.甲级刷题资源【2】4.甲级刷题索引【3】...
2020-01-25 18:29:58 259
原创 【pytorch阅读笔记】pytorch基础知识
本部分共分为5部分:基本数据Autograd与计算图神经网络工具箱:torch.nn模型处理 torchvision.model数据处理pytorch最大的优势是可以使用tensor代替numpy进行对应的矩阵操作并且支持对应的GPU加速。1.pytorch基本数据: tensortensor的使用类似于numpytensor创建与维度的查看 torch.tensor...
2020-01-21 12:06:28 2700
原创 【科研论文】审稿人的回复技巧
鄙人第一次写论文,大修论文,为此需要进行对应的给审稿人的回复信,于是查阅别人的回复心得,并书写记录如下整篇论文结构List of Actions 列出所有修改的条目,让审稿人,编辑对论文的修改量有一个大致概念Res of Editor 对编辑的答复Res of Review 对审稿人的答复argue的思路思路一(第一阶段)肯定审稿人说的很对,他提出的思路非常好...
2020-01-12 09:33:55 5097 1
原创 【数据集转换】COCO数据集格式
简介COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), and image captions(看图说话),使用JSON文件存储。格式结构{ "info": info, "licenses": [license], "images": [image], #划入训练集(或者测试集)的图片...
2019-10-30 18:14:35 2164
原创 【Python基础函数】
_ call _call()的本质是将一个类变成一个函数(使这个类的实例可以像函数一样调用)。class A(object): def __init__(self, name, age): self.name = name self.age = age def __call__(self): print('my name is ...
2019-10-30 16:02:40 252
原创 conda环境移植
前言Python配环境是真的麻烦,为了能进行环境移植,特意写了此篇博文方法一conda info -e查看已配置完成的环境地址conda create -n BBB --clone ~/path把原来电脑上目标conda环境的目录复制到新电脑上使用该命令进行conda环境的移植,创建一个BBB环境,从~/path移植过来注意事项:配置环境时尽量使用conda install。 ...
2019-10-25 16:17:19 531
原创 场景文本检测整理【不规则文本】
由于某些原因,被SCDN技术部给吃了,只能补一份,后期有时间不定期更新剩下的东西综述类文献整理金连文团队【汇报】对应整理的文档【github 检测】【GitHub 识别】【Github 端到端】一个github上的OCR整理【地址】【OCR检测十全大补丸】【白翔ICCV汇报】【2017-2018 OCR paper整理】【2018 OCR 论文盘点】不规则文本检测专题2...
2019-10-25 15:44:44 1173
原创 CV 论文模板(八股文笔记心得)
最近准备写篇正儿八经的论文,于是针对OCR领域的论文进行八股文模板的总结,仅个人感觉,如有不同,欢迎指正。摘要介绍应用领域说明存在的问题提出自己的方法自己方法的优势在数据集上的实验效果简介第一段:介绍领域领域在现实中的应用如今的大部分工作集中在哪些问题第二段仍然存在的挑战 (这里主要提出你的问题)第三段:介绍自己的方法第四段介绍...
2019-10-23 21:04:20 1321
原创 【论文研读笔记---十】Mask-RCNN
论文研读系列汇总:1.AlexNet论文研读2.VGG论文研读3.GoogLeNet论文研读4.Faster RCNN论文研读5.ResNet 论文研读6.SENet 论文研读7.CTPN 论文研读8.CRNN 论文研读9.EAST 论文研读10.Mask-RCNN论文研读作为一个best paper的6千star项目,会在读完对应论文的同时,更新对应的代码研读,希望比之前...
2019-10-15 18:25:03 377
原创 【深度学习基础】损失函数
深度学习基础:性能评估指标超参数介绍3.损失函数前言本文主要总结一下常见目标检测的损失函数以及一些基础的函数,包括:MSE均方误差损失函数、Cross Entropy交叉熵损失函数目标检测中常用的Smooth L1损失函数focal loss损失函数:共分为两类,分类问题的损失,和回归问题的损失。均方差损失函数均方差损失函数常用在最小二乘法中。它的思想是使得各个...
2019-10-13 16:12:17 2958
原创 【论文研读】Faster-RCNN原理精读
前言:半年前有读过对应的Faster-RCNN的论文,包括看过很多讲解,随着领域知识的不断加深,对这一经典论文的理解也更加深度,重新读关注更多细节问题,也获得了不少新的知识,原始研读文更关注论文本身的创新点,原研读文链接【Faster-RCNN】,可作为辅助参考。本博文则更关注完整流程内容细节方面的知识,希望能给大家启发。完整流程概览这是一个faster-rcnn的简单流程图,在看mask...
2019-10-11 16:29:28 585
原创 【代码研读】Mask RCNN代码阅读笔记(二)骨架网络backbone和入口
前言笔记分为三个部分,backbone,rpn,roi_head三个部分,之前的项目总览见【链接】。本文主要是讲解backbone部分的文件,通过在总体把握和实现细节两个方面对其进行记录。│ │ ├── detector│ │ │ ├── detectors.py #检测的代码入口│ │ │ ├── generalized_rcnn.py #生成各种组合的...
2019-10-09 15:47:23 2326
原创 【代码研读】Mask RCNN代码阅读笔记(一)总览篇
前言:mask-rcnn作为如今领域流行的代码框架,被广泛应用,为了学习的需要,结合网上的教程,写了以下的代码研读笔记阅读的代码为:mask-rcnn benchmark【github地址】整体架构:mask-rcnn核心代码方面主要分为三个部分:backbone(骨架特征提取网络)+rpn(粗分类的区域提议网络)+roi_head(实现各部分功能的集成模块,如mask/detct...
2019-10-08 18:36:33 791
原创 【模型压缩方法总览】深度学习调研
模型压缩原因论文Predicting parameters in deep learning提出,其实在很多深度的神经网络中存在着显著的冗余。仅仅使用很少一部分(5%)权值就足以预测剩余的权值。该论文还提出这些剩下的权值甚至可以直接不用被学习。也就是说,仅仅训练一小部分原来的权值参数就有可能达到和原来网络相近甚至超过原来网络的性能(可以看作一种正则化)。Krizhevsky在2014年的文章中...
2019-09-21 15:58:53 1715
原创 【深度学习研读系列】轻量级网络模型Mobilenet,Shufflenet
深度可分离卷积以及对应的轻量级网络模型参考文献:mobilenet:通过Depthwise+Pointwise可以近似看作一个卷积层:(深度可分解卷积和1*1卷积结合)普通卷积:3x3 Conv+BN+ReLUMobilenet卷积:3x3 Depthwise Conv+BN+ReLU 和 1x1 Pointwise Conv+BN+ReLU这样的卷积方式通过将深度进行分解卷积,...
2019-09-07 19:51:55 487
原创 pycharm高级功能 (debug调试)
断点调试是在开发过程中常用的功能,能清楚看到代码运行的过程,有利于代码问题跟踪。对我这个小白开发来说,还有一个作用是快速熟悉代码,拿到别人写的代码,有时看不太懂或看的很吃力,光这样看很无感,但是通过断点调试,可以很清楚的看到代码是怎么走的,每一步的参数的值等,驱动代码熟悉。pycharm打断点很简单,在代码行号后空白槽点击一下,出现红球,就可以了。当Pycharm运行到该行代码时会将程序暂时挂起...
2019-09-07 19:51:26 1471
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人