自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (2)
  • 收藏
  • 关注

原创 python中对heic、heif格式图片转jpg

HEIC、HEIF格式图片转JPG格式

2023-07-20 14:36:56 997

原创 YOLOv5-6.x 显示中文标签

在做车牌识别的时候,将YOLOv5检测到的车牌送入到LPRNet网络中识别,然后将识别的结果在图片中显示出来。因为有中文,所以显示不出来,按照下面步骤修改,可以成功显示。

2023-03-26 15:58:49 538 2

原创 opencv python接口中cv2.imread()函数不能读中文文件名文件

图像为中文文件名

2023-02-28 09:51:44 251

原创 VS C++在图片中打印中文出现乱码 ???

1.首先putText不支持在图片上输出中文,因此不能使用这个API。使用cv::putText在图片上打印中文出现?3.转码UTF8转GBK。4.使用自定义函数实现。

2022-11-28 15:35:18 689

原创 安装paddlex出现“ERROR: Could not build wheels for pycocotools, which is required to install pyproject‘

百度云下载后是一个压缩包的形式,但不要解压,直接右击选择打开方式,资源管理器的方式打开,然后就是下面这样。用paddle官方提供的下载文件安装时报错安装包地址搜索不到。安装Visual Studio,百度云下载地址参考。虽然还报了个问题,但好像不耽误使用。在安装pallex时出现报错。然后再重新用pip进行安装。

2022-11-28 15:26:00 1613

原创 深度学习面试基础--训练参数更新方法

想象一下纸团在山谷和鞍点处的运动轨迹,在山谷中纸团受重力作用沿山道滚下,两边是不规则的山壁,纸团不可避免地撞在山壁,由于质量小受山壁弹力的干扰大,从一侧山壁反弹回来撞向另一侧山壁,结果来回震荡地滚下;momentum即动量,它模拟的是物体运动时的惯性,即更新的是时候在一定程度上保留之前更新的方向,同时利用当前batch的梯度微调最终的更新方向。SGD就是最常听到的随机梯度下降方法,是使用参数的梯度,然后沿梯度的方向更新参数,并重读这个步骤多次,从而逐渐靠近最优参数。学习越深入,更新的幅度就越小。...

2022-08-02 07:00:00 935

原创 深度学习面试基础--BN层

深度学习中BN层的相关介绍

2022-08-01 09:58:34 6570

原创 深度学习面试基础--激活函数篇

激活函数的作用激活函数对于人工神经网络模型去学习、理解复杂和非线性的函数具有十分重要的作用。可以将非线性特性引入到网络中。如果不用激活函数,每一层的输入都是上一层输出的线性函数,无论神经网络有多少层,输出都是输入的线性组合。............

2022-07-31 15:57:22 367

原创 CVPR2020: Video Panoptic Segmentation

摘要全景图分割是通过统一以往语义分割和实例分割任务,称为视觉识别任务的新标准。1.在本文中,我们提出并探索了一种新的视频扩展任务,称为视频全景分割。该任务要求生成一致的全景分割以及跨视频帧的实例ID关联。2.为了激励对这一新任务的研究,我们提出了两种类型的视频全景数据集。第一个是将合成的VIPER数据集转换为视频全景格式,以利用其大规模标注。第二个是Cityscapes val.set的时间扩展,通过提供新的视频全景注释(Cityscapes-VPD)。它通过每5个视频帧的像素级全景标签,将Citys

2021-11-15 10:41:07 688

原创 Win10网络诊断提示:远程计算机或设备将不接受连接 已解决

1.右击“网络”,点击打开属性面板2.选择左下角“Internet选项”3.选择“连接”,点击“局域网设置”5. 将其它都取消掉,只选择“自动检测设置”6. 点击“确定”、“应用”

2021-11-12 13:42:48 38161 8

原创 Panoptic-DeepLab: A Simple, Strong, and Fast Baseline for Bottom-Up Panoptic Segmentation

摘要在这项工作中,我们引入了Panoptic-DeepLab,一个简单、强大、快速的全景分割系统,旨在为bottom-up方法建立一个baseline,可以实现与两阶段方法相当的性能,同时产生快速的推理速度。特别是,Panoptic-Deeplab分别采用了针对语义和实例分割的双ASPP和双解码结构。语义分割分支与任何语义分割模型(如DeepLab)的典型设计相同,而实例分割分支是class-agnostic,包括一个简单的示例中心回归。引言由于最近提出的全景质量度量和相关的识别挑战,统一了语义分割和

2021-11-09 15:43:49 1384

原创 PointRend: Image Segmentation as Rendering论文翻译

摘要通过模拟计算机图形学的方法,针对在语义分割中出现的过拟合和欠拟合问题,将分割问题看做图像渲染问题。基于此,提出了PointRend(基于点渲染)神经网络模块。该模块基于迭代细分算法,在自适应选择的位置进行基于点的分割预测。PointRend模块能够很灵活的被嵌套加载运用于现今存在的各个实例和语义分割模型上。定性的讲,PointRend能够对物体的边缘进行更好的分割(crisp object boundaries);定量的讲,在COCO相关的数据集上均取得了长足的进步,并且其显存的高效利用使得其输出的分

2021-11-06 12:59:19 271

原创 An End-to-End Edge Aggregation Network for Moving Object Segmentation论文翻译

摘要视频运动目标分割(MOS)是一项高要求的任务,适用于自动户外视频监控等安全应用场景。现有的MOS算法大多都依赖于在测试序列的第一帧或复杂的训练过程中微调模型,从而限制了算法的实际应用能力。本文提出了基于相关学习的边缘提取机制EEM和密集残块DRB的识别前景表示方法。多尺度EEM通过后续尺度的跳跃连接,将有效的前景边缘相关信息借助编码器提供给解码器。此外,光流编码器流和最后一个EEM模块的响应被嵌入到桥接网络中。桥接网络由多尺度密集连接的残块组成,学习前景相关特征。最后,为了生成准确和一致的GT目标图,

2021-11-04 14:25:30 384

原创 Rethinking BiSeNet For Real-time Semantic Segmentation 论文翻译

摘要BiSeNet已被证明是一种用于实时分割的流行的双边网络。然而,它添加额外路径已编码空间信息的原理是耗时的,并且由于特定任务设计的不足,从预训练的任务(如图像分类)中借用骨干网络来进行语义分割可能是低效的。为了解决这些问题,我们提出了一种新的高效的结构,即短时密集连接网络(Short-Term Dense concatenate network, STDC network)。具体来说,我们逐步降低特征图的维数,并利用特征图的聚集来进行图像表示,形成了STDC网络的基本模块。在解码器中,我们提出了一个D

2021-11-04 10:51:36 359

原创 BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation论文翻译

摘要语义分割既需要丰富的空间信息,又需要大量的感受野。然而,现代方法通常会牺牲空间分辨率来实现实时推理速度,导致性能较差。在本文中,我们用一种新的双边分割网络BiSeNet来解决这个问题。首先设计了一个小步幅的空间路径,以保留空间信息并生成高分辨率的特征。同时,采用快速下采样策略的上下文路径获得足够的感受野。在这两条路径上,我们引入了一个新的特征融合模块来有效的组合特征。BiSeNet论文地址引言实时语义分割算法主要的三种方法:1.尝试限制输入大小以通过裁剪或调整大小来降低计算复杂性。虽然该方法简

2021-11-03 09:34:17 378

原创 cityscapes数据集上的类别统计分布

在cityscapes数据集上统计每类标签的个数因为cityscapes数据集上的标签是由json格式组成,因此需要对json格式进行读取,然后发现cityscapes数据集上的类别信息在json中的“object”下的“label”中博主这里只统计了19个类别的分布,并且省略了背景,如果需要34类别,自行在相应地方添加即可将base_path中的train改为test、val则统计相对应数据集的分布所以最终代码为"""数据集分析"""import jsonimport osfrom m

2021-10-27 16:40:59 3760 1

基于Xception进行图像车辆分类

使用Xception网络进行车辆分类,内容包含:训练好的一个模型,模型代码,训练代码,评估代码

2021-10-28

使用ResNet进行车辆分类

使用ResNet进行车辆分类,模型保存、模型测试,以及记录的笔记和训练图

2021-10-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除