![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
文章平均质量分 69
北落师门XY
这个作者很懒,什么都没留下…
展开
-
Swin Transformer
VIT代表着Transformer正式席卷CV领域,一般就用来进行分类;SwinT则是一种更精进的方法,支持高分辨率的场景,还实现了卷积中常见的特征金字塔结构,在SwinT基础架构上改造,可以用于图像分类、目标检测、语义分割。VIT通过切patch,将每个patch用一个token表示,实现了降低复杂度。SwinT既想高分辨率,又想降低复杂度,所以设计成仅在patch内计算局部的attention(降低复杂度),patch内每个点都是token。为了获得全局的attention,设计了移动窗口机制。....原创 2022-07-18 19:16:11 · 353 阅读 · 0 评论 -
Vision Transformer(VIT)
VIT代表着transformer向cv领域的正式进军,nlp在transformer中将字符转为token,如要将cv中每个像素点作为token,224*224=50176>>512,参数量巨大。VIT提供了一个成功的思路将图像转为一定长度的token又能保留二维空间信息。VIT步骤为:1、将图像切分为patch,如将224*224的图片切成16*16的patch,每个patch的大小为16*16*32、将patch信息拉平,线性层映射为指定位数如768或1024(embedding size),这一步也原创 2022-07-08 11:46:32 · 1422 阅读 · 0 评论 -
表格解析算法——PaddlePaddle之RARE
百度paddlepaddle paddleocr下pp-structure包含了版面分析及表格解析两项工作,本文是对表格解析的技术详述。代码:https://github.com/PaddlePaddle/PaddleOCR简要概览:PaddleOCR新发版v2.2:开源版面分析与轻量化表格识别_飞桨PaddlePaddle的博客-CSDN博客RARE 百度paddlepaddle包含表格解析功能,被称为RERE算法。RARE算法原本用于进行文本识别...原创 2022-03-21 15:14:40 · 7233 阅读 · 0 评论 -
PYTHON中基于OPENCV进行图像压缩
JPG的图像是有损压缩的,有时场景需要人为地对图像进行压缩。例如:显存溢出时进行cv2.resize操作,减小输入图像尺寸;当图像文件大小太大时,例如超过了上限10M,这时可以通过控制图像质量的方式压缩像素所占字节大小。基本知识:RGBA:A(Alpha)指图像的透明和半透明度,1位存储时表示透明或不透明,多位存储时表示不同的透明度位深度:单个像素单个通道所占比特数,常见为8bit,0-255范围色深:单个像素所有通道所占比特数,常见为3*8=24情况一:cv2....原创 2022-03-15 15:07:25 · 9665 阅读 · 0 评论 -
hashlib库摘要算法
在很多场景中需要对图像进行编码,用于去重、反欺诈或获得唯一的图片名称,一个简单的方法是获得md5码。摘要算法另一个应用是存储用户账户密码,可实现加密存储,且无法解密,是不可逆的。加盐:对所有口令增加字符串再计算加密值的方法称为加盐。get_md5(password + 'the-Salt')。目的是防止简单口令被黑客反推。常见的破解方法是先列举常用密码,预先获得这些加密值。加盐可应对这种破解方法。碰撞:将一个无限数据集映射到有限数据集,必然可能出现不同数据映射到一个摘要的情况。概率极...原创 2022-02-28 14:36:04 · 2666 阅读 · 0 评论 -
opencv常用函数
以下都基于import cv2一、绘制cv2.line() cv2.circle() cv2.rectangle() cv2.ellipse() cv2.putText()二、基础操作平移 cv2.warpAffine()绕中心点旋转 cv2.getRotationMatrix2D设置旋转矩阵cv2.warpAffine仿射变换缩放 cv2.resize 注意:官方建议缩小用cv2.INTER_AREA,放大用CV2.INTER_LINEAR(默认)翻转 cv2...原创 2020-12-07 17:18:37 · 334 阅读 · 0 评论 -
python应用——将raw文件转化为jpg文件,并显示图像
例一:一、要求读入0.raw的文件,转化为0.jpg文件。二、代码import numpy as npimport imageiorawfile = np.fromfile('0.raw', dtype=np.float32) # 以float32读图片print(rawfile.shape)rawfile.shape = (480, 640)print(rawfile...原创 2018-08-26 16:55:10 · 18156 阅读 · 10 评论 -
CV2与PIL
一、打开与显示import cv2from PIL import Imageimport matplotlib.pyplot as pltimg_path = 'E:\\360MoveData\\Users\\Administrator\\Desktop\\111.JPG'img_cv = cv2.imread(img_path)cv2.imshow('111', img_cv)cv2.waitKey()img_PIL = Image.open(img_path)plt.imsho原创 2020-05-18 22:44:21 · 1840 阅读 · 0 评论