Deeping learning
文章平均质量分 64
追天一方
以梦为马,砥砺前行
展开
-
深度学习中训练自己的模型的时候该如何设置学习率呢?
深度学习中训练自己的模型学习率的设置原创 2024-01-06 12:33:41 · 631 阅读 · 0 评论 -
计算机视觉数据增强系列1
突然想总结一下数据增强,这篇博客主要针对于场景文字检测的数据增强,主要是多边形。当然目标检测也是同理,毕竟同样都是点集。原创 2022-10-07 20:48:03 · 1523 阅读 · 0 评论 -
场景文字检测DBnet论文解读
最近接触到了文字检测,学习一下DBnet。DBnet提出了一个可微二值化(DB)模块,该模块可以在分割网络中进行二值化处理。与DB模块一起优化的分割网络可以自适应地设置二值化的阈值,不仅简化了后处理,而且提高了文本检测的性能。标准的二值化过程是不可微的,作者提出了一个近似二值化函数代替标准二值化,也就是这个DB模块,并且DB模块在推理阶段还可以删除,不影响推理速度。两个函数图像对比如下:DBnet的优点如下:(1)DBnet能检测任意形状文本,并且在各个数据集上取得了好性能。原创 2022-09-11 16:08:03 · 2775 阅读 · 0 评论 -
python深度学习中registry机制,mmcv中的registry的注册机制示例(其他工具箱的也是类似的)
目录前言一.什么是registry机制二.registry示例1.创建注册表2.注册表添加类3.测试三.总结前言现在好多项目都会用到registry机制,学习一下一.什么是registry机制简单来说registry可以提供字符串到python中类的映射,registry能让开发者输入相应的类名和参数,就能获得一个初始化好的类。也就是说像是这样,下面这是一个类:class aclass(object): def __init__(self): ... def ... ...然后通原创 2022-03-17 16:23:02 · 7036 阅读 · 4 评论 -
深度学习-yolo-fastestV2使用自己的数据集训练自己的模型
前言虽然说yolo-fastestV2在coco数据集上只达到了24.1,但是应付一些类别少的问题还是可以的。主要是这个速度是真的香!简单来说就是一个快到飞起的模型。1.关于yolo-fastestV2github地址如下:yolo-fastestV2yolo-fastestV2采用了轻量化网络shufflenetV2为backbone,笔者在这里就不详解yolo-fastestV2了,只讲怎么训练自己的yolo-fastestV2模型。2.修改训练代码训练部分的代码只修改了一小部分,如下:i原创 2021-12-20 00:46:41 · 6398 阅读 · 89 评论 -
self-attention机制通俗的理解,transformer中的注意力机制。
前言看了一下今年关于transformer的paper,感觉对self-attention机制了解地更加深入了。self-attention首先说什么是self-attention,简单来说self-attention就是计算自己与自己地关联性。比如在cv中,我们可以这么理解,通过self-anttention可以计算每个像素点之间地关联性。先上图:给定大小为 H ∗W ∗C的输入2D图 ,我们通过(Wq,Wk,WV)将输入数据X转换为Q=XWq,K=XWk ,V=XWv 之后,其中Wq,Wk原创 2021-08-18 10:09:44 · 1215 阅读 · 0 评论 -
Batch Normalization(批标准化)
前言:好吧,又是补习算法原理的一天在神经网络的训练当中,需要各层的激活值分布拥有适当的广度,从而可以顺利地进行学习。那么,为了使各层分布拥有适当的广度,强制性地调整激活值的分布,这就是Batch Normalization算法,Batch Normalization调整的思路就是调整各层的激活值使其拥有适当的广度。Batch Normalization有以下优点1.可以使学习更快进行2.不那么依赖初始值3.抑制过拟合算法公式Batch Normalization,就是以进行学习时的mini-b原创 2021-07-15 23:42:59 · 619 阅读 · 2 评论