自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 深度学习——优化器算法Optimizer详解(BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam)

首先来看一下梯度下降最常见的三种变形 BGD,SGD,MBGD,这三种形式的区别就是取决于我们用多少数据来计算目标函数的梯度,这样的话自然就涉及到一个 trade-off,即参数更新的准确率和运行时间。

2024-06-16 20:42:56 1276

原创 OCR综述

¶OCR(Optical Character Recognition,光学字符识别)是指对图像进行分析识别处理,获取文字和版面信息的过程,是典型的计算机视觉任务,通常由文本检测和文本识别两个子任务构成。文字检测:将图片中的文字区域位置检测出来(如图1(b)所示);文字识别:对文字区域中的文字进行识别(如图1(c)所示)。

2024-06-14 18:46:26 2071 2

原创 计算机视觉与卷积神经网络

经过几亿年的演化,目前人类的视觉系统已经具备非常高的复杂度和强大的功能,人脑中神经元数目达到了1000亿个,这些神经元通过网络互相连接,这样庞大的视觉神经网络使得我们可以很轻松的观察周围的世界,如。未来,随着技术的不断演进,必将涌现出更多的产品和应用,为我们的生活创造更大的便利和更广阔的机会。计算机视觉作为一门让机器学会如何去“看”的学科,具体的说,就是让机器去识别摄像机拍摄的图片或视频中的物体,检测出物体所在的位置,并对目标物体进行跟踪,从而理解并描述出图片或视频里的场景和故事,以此来模拟人脑视觉系统。

2024-06-14 18:33:23 264

原创 车牌识别代码

【代码】车牌识别代码。

2024-06-05 18:47:39 102

原创 labelimg使用教程

zlabels现在是一个空文件(标注后存放的格式.txt或.html)在安装好labelimg后先准备好两个文件名字随意。zimges是存放图片的文件(你想标注的图片)我选的格式是yolo生成的是.txt文件。在python中运行labelimg。

2024-06-05 18:33:46 180

原创 yolov5改为自己的数据集

在models中创建mydata.yaml复制使用的yaml如yolov5l.yaml、yolov5m.yaml、yolov5n.yaml、yolov5s.yaml、yolov5x.yaml等修改分类个数.我这里使用的是yolov5s.yaml所以复制它。yolov5中是我标注好的数据集其中images/train2017是标注好的图片labels/train2017是存放的是标注好的.txt格式的图片。先运行train.py运行完重构best.py在运行detect.py或test.py都行。

2024-06-04 08:43:48 907

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除