自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 图像分割之U-Net、U2-Net及其Pytorch代码构建

图像分割之U-Net、U2 -Net及其Pytorch代码构建1、图像分割图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。做法便是对图片中的每一个像素进行分类。在自动驾驶、自动抠图、医疗影像等领域有着比较广泛的应用。图像分割大致可分为以下三类:普通分割:将不同分属不同物体的像素区域分开。比如前景和背景分割开,狗的区域和猫的区域与背景分割开。语义分割:在普通分割的基础上,分类出每一块区域的语义(即这块区域是什么物体)。如把画面中的所有物体都指出他们各自的类别

2022-05-24 19:06:58 4201 12

原创 基于深度学习的仪表读数读取

基于深度学习的仪表盘识别代码:https://github.com/HibikiJie/ReadMeter权重文件:链接: https://pan.baidu.com/s/1wTPo1wJXrNyEFSu8RrD8Xw 密码: t0p4将其放置于weight文件夹下,运行test.py,即可测试data\images\val下的图像文件讲解使用语义分割模型,在不同通道上分割出表盘和指针环形的表盘展开为矩形图像二维图像转换为一维数组对刻度数组用均值滤波定位指针相对刻度的位置输出相对位置

2022-03-08 14:42:33 10788 72

原创 基于深度学习的车牌检测识别(Pytorch)(ResNet +Transformer)

车牌识别概述基于深度学习的车牌识别,其中,车辆检测网络直接使用YOLO侦测。而后,才是使用网络侦测车牌与识别车牌号。车牌的侦测网络,采用的是resnet18,网络输出检测边框的仿射变换矩阵,可检测任意形状的四边形。车牌号序列模型,采用Resnet18+transformer模型,直接输出车牌号序列。数据集上,车牌检测使用CCPD 2019数据集,在训练检测模型的时候,会使用程序生成虚假的车牌,覆盖于数据集图片上,来加强检测的能力。车牌号的序列识别,直接使用程序生成的车牌图片训练,并佐以适当的图像

2021-09-15 23:49:38 21358 15

原创 BYOL(Bootstrap your own latent A new approach to self-supervised Learning)算法笔记

Bootstrap your own latent A new approach to self-supervised Learning引导你自己潜在的自我监督学习的新方法论文链接:https://arxiv.org/abs/2006.07733复现代码:https://github.com/HibikiJie/BYOL\为什么使用自监督学习网络更加庞大,难以训练,需要大量的标记数据来监督训练,成本过高。所以需要一种自监督学习,来训练网络,使网络更加泛化。网络没有预训练,直接使用在自己

2021-06-17 14:27:01 1211 6

原创 用于异常检测的多分辨率知识蒸馏

Unsupervised representation learning has proved to be a critical component of anomaly detection/localization in images. The challenges to learn such a representation are two-fold. Firstly, the sample size is not often large enough to learn a rich generaliz

2021-05-08 18:04:43 2216 1

原创 深入浅出自然语义处理原理并构建自然语义处理(NLP)模型GPT2

NLP自然语言处理,GPT2模型1、词向量在图像的处理中,我们无需对图像进行特殊的处理,因为图像本身就是由矩阵来表示的。而处理自然语言的时候,语言是由每一个字、词组成的。而字、词是通过编码存储在计算机当中的。所以我们可以通过将字、词编码成为向量的形式,如此就可以输入进深度学习网络模型中。但是我们应该如何去编码呢?像做图像分类那样,使用one—hot的形式编码?但是这样会存在一个问题,在自然语言中,存在着词和词之间的关系,字和字之间的关系。例如近义词,反义词,同属性的词语。例如:‘beijing’

2021-02-04 16:03:28 1514

原创 倾斜目标矩形框的目标侦测

1、倾斜目标框在构建led读数识别时,遇见如下图所示的倾斜的识别对象。在标注水平侦测框的时候,是如下图所示标注的。在识别led读数中,会将侦测到的图像部分,resize至具有同样高度的尺寸上,虽然在宽度W维度上,不受限制,但其高度H的信息压缩过多,对数字序列的识别是不利的。因此,给出这样的一个建议框才是合适的:那这样一个目标狂应该如何表示呢?2、c_x、c_y、w、h、theta很自然的就会首先想到这样的方案,但是这样表示一个倾斜的目标框是有问题的。首先是theta角度的周期性,会出现下

2021-02-03 10:18:46 2466

原创 深入浅出Alpha Zero技术原理

深入浅出Alpha Zero技术原理1、蒙特卡洛树搜索(1)蒙特卡洛方法蒙特卡罗法也称统法模拟法、统计试验法。是把概率现象作为研究对象的数值模拟方法。上图中,求中间曲线区域的面积。曲线区域的面积不易计算,而正方形面积易于计算。则可以进行随机地采样,将属于曲线内的点的数量记作NaN_{a}Na​,一共采样了N次。则中间曲线区域的面积为:S=SsquareNaNS=S_{square} \frac{N_{a}}{N}S=Ssquare​NNa​​SSS -曲线区域面积SsquareS_{s

2020-11-02 15:23:55 7283 2

原创 快速风格迁移(Fast Neural Style Transfer)及pytorch实现

Fast Neural Style Transfer1、简介在原始风格迁移中,是以一张图片作为参数来训练它。生成一张图片则需要数分钟不等的时间。如果以网络来转换图片,我们训练这个网络,那么则能够快速的将图片进行风格转换,而无需迭代一张图片数百至千次。于是我们所需要做的则是定义这个风格转换网络。2、网络定义网络结构如上。类似于自编码解构,先压缩图片,再还原回来。此外,网络的上采样,采用的是先放大图片再卷积的形式,而非反卷积。于是构建出网络:class ResBlock(nn.Modul

2020-10-27 13:51:40 7567 52

原创 强化学习DQN并玩CartPole游戏

强化学习DQN并玩CartPole游戏1、强化学习一张经典的关于强化学习的图。一个代理(Agent)存在一个空间中,并观察环境,得到该环境的状态(observation),于是做出一个动作(action),一旦发出了动作则会改变环境,环境的改变则产生一个回报(reward)给代理,回报有正有负、有大有小。强化学习是,让代理在该环境中生存。不断地试错,以试图获取最大的回报。这便是强化学习的过程。2、马尔科夫链在代理不断地观察环境做出动作得到回报,观察环境做出动作得到回报,…,观察环境做出动作得

2020-10-16 17:24:26 1180

原创 风格迁移StyleTransfer和Pytorch实现

风格迁移及Pytorch实现风格迁移,就是利用算法学习一幅画的风格,然后再把这种风格应用到另外一张图片上。本篇文章会介绍其原理,并使用Pytorch实现。在卷积中,浅层特征越具体,深层特征则越抽象);从风格角度来说,浅层特征则记录着颜色纹理等信息,而深层特征则会记录更高级的信息。主要方式则是,随机一张图片,通过优化内容损失和风格损失,改变该图,使其内容接近内容图片,风格上接近风格图片。内容损失:直接计算特征图的欧式距离;风格损失:计算特征图的格拉姆矩阵的欧式距离格拉姆矩阵的计算方式:def

2020-10-13 09:55:50 1579 8

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除