机器学习vs计算机视觉
文章平均质量分 50
专栏主要介绍计算机视觉工程师学习过程中要掌握的基础知识。深度学习模型搭建及工程应用;常用经典分类模型的应用知识;YOLO系列目标检测,算法简介,模型代码,YOLOV3模型数据集制;目标检测FASTERRCNN;MASKRCNN目标分割;SkyEye智慧眼系统搭建;MTCNN 模型;FaceNet;
优惠券已抵扣
余额抵扣
还需支付
¥69.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
@@南风
这个作者很懒,什么都没留下…
展开
-
基于YOLOv4的交通视频监控车辆识别
Vehicle Identification from Traffic Video Surveillance Using YOLOv4原创 2022-12-18 17:04:08 · 2038 阅读 · 1 评论 -
基于深度学习的目标检测和改进的监控视频异常检测
探索了视频处理的一些特征,并试图结合使用它们的数据以获得更好的结果。原创 2022-12-18 15:14:27 · 1272 阅读 · 0 评论 -
基于深度学习的物联网远程监控目标检测
主要研究了一种利用深度神经网络和物联网对目标进行检测,并将检测到的信息以低传输速率传输到云端的框架。原创 2022-12-16 11:23:26 · 1439 阅读 · 0 评论 -
视频监控系统综述
越来越多的安全与监控系统被用于控制和预防异常事件,特别是在态势感知应用中,以确保公共安全。需要一个系统,以确保良好的管理和控制社会的所有生活部分也是必要的。这些系统的主要利益是简化人们的生活,使其自动监控和更安全。原创 2022-12-06 00:18:59 · 548 阅读 · 0 评论 -
用于交通事件前检测的实时视频监控系统
提出了一个概念框架,以发展一个以视像监视为基础的系统,以改善道路安全。在该框架的基础上,开发了一套能够从交通视频中检测各种交通事前事件的算法,如超速、单向交通、超车、违规停车和错误的乘客下车位置原创 2022-12-05 22:21:43 · 658 阅读 · 0 评论 -
基于SiamMask网络的智能视频监控实时人员跟踪系统
介绍了一种利用架空摄像机视角的实时人物跟踪和分割系统。该系统采用了一种基于深度学习的算法,即SiamMask算法,简单、通用、快速,超越了其他实时跟踪算法。该算法还通过将掩码分支与全卷积双神经网络相结合,实现目标人的分割,用于目标或人的跟踪。原创 2022-12-04 15:38:43 · 749 阅读 · 0 评论 -
基于深度学习的木薯叶片病害识别与检测
根据联合国粮食及农业组织(FAO),农业是世界总人口约60%的主要生计来源。发展中国家的经济完全依赖农产品。随着世界人口以更快的速度增长,对粮食的需求也在急剧上升。最近几天,农业正在经历一场自动化革命。因此,人工智能等破坏性技术的引入在提高农业生产率方面发挥了重要作用。人工智能支持的方法将有助于克服农业实践中面临的传统挑战,实现各种农业相关任务的自动化。如今,农民采用精准农业,即在作物健康监测、杂草检测、植物病害识别和检测、天气预报、商品价格预测等方面使用人工智能技术来提高产量。由于农业部门人力短缺,机器人原创 2022-05-08 21:01:55 · 2402 阅读 · 1 评论 -
基于深双线性神经网络的植物病害分类(移动API+源代码)
植物病害已成为农业和粮食供应的主要威胁。各种植物病害影响了植物的自然生长,受感染的植物是造成作物减产的主要因素。人工检测和鉴定植物病害需要通过专业知识进行仔细的观察检查。为了克服手动测试程序,可以采用自动识别和检测,从而提供更快、可扩展和精确的解决方案。在这项研究中,我们的工作有三方面的贡献。首先,提出了一种用于植物叶片病害识别和分类的双线性卷积神经网络。其次,我们对VGG和修剪后的Resnet进行微调,将它们用作特征提取器,并将它们连接到完全连接的密集网络。在双CNN(s)的随机优化过程中,调整超参数以达原创 2022-05-04 17:09:38 · 1139 阅读 · 1 评论 -
使用MaskAL的主动学习减少了训练Mask时的注释工作量 R-CNN的一个花椰菜数据集
卷积神经网络(CNN)的泛化性能受训练图像的数量、质量和种类的影响。训练图像必须进行注释,这既耗时又昂贵。我们工作的目标是减少训练CNN所需的带注释图像的数量,同时保持其性能。我们假设,通过确保训练图像集包含大量难以分类的图像,可以更快地提高CNN的性能。我们的研究目的是用一种能够自动选择难以分类的图像的主动学习方法来检验这一假设。我们开发了一种基于掩模区域的CNN主动学习方法(Mask R-CNN),并将其命名为MaskAL。MaskAL参与了Mask R-CNN的迭代训练,训练后的模型被用来选择一组未标原创 2022-05-03 15:47:48 · 401 阅读 · 0 评论 -
一种非常好用的图像处理软件
1、实际效果2、下载https://en.softonic.com/download/image-analyzer/windows/post-downloadhttps://image-analyzer.en.softonic.com/.原创 2021-09-29 14:37:11 · 114 阅读 · 0 评论 -
基于深度学习的大豆叶片病害识别(自然环境下1470张图像)
Abstract本文提出了一种利用卷积神经网络(CNN)识别自然环境下大豆叶片病害的新方法。使用AlexNet、GoogLeNet和ResNet进行迁移学习。首先,通过设置不同的批量大小和迭代次数,得到27个模型;然后,研究了CNN结构对识别性能的影响。最优模型基于ResNet,准确率最高,为94.29%。在最优网络的参数设置中,迭代次数为1056次,批量大小为16次,训练深度为140。总之,该方法对自然环境下大豆叶片病害的识别是有效的。KeywordsSoybean leaf diseases;Dee原创 2021-09-28 14:59:15 · 1331 阅读 · 0 评论 -
大豆叶片病害检测与分类系统
Abstract我国经济高度依赖农业生产力,病害检测在农业生产中占有重要地位。这个项目的目的是支持农民检测大豆栽培中的疾病类型。***这样做的目的是确定叶子是健康的还是有病的,如果它受到了影响,找出疾病并确定感染的百分比。******在聚类算法的帮助下完成分割阶段,然后使用无监督学习算法进行分类。系统使用颜色和纹理特征的组合进行训练。***利用我们的想法,可以识别大豆疾病,平均准确率为91%。Keywords— septoria leaf blight, frog eye, downy mildew,原创 2021-09-28 16:08:56 · 565 阅读 · 0 评论 -
基于深度学习的大豆病虫害自动计数(SLIC超像素方法进行图像分割)
A Deep-Learning Approach for Automatic Counting of Soybean Insect PestsAbstract大豆田虫害的发生使全世界的农民感到担忧。虫害数量的早期和自动诊断可以评估每个种植区的虫害水平,以优化作物中农药的应用,从而降低生产成本和环境影响。最近关于昆虫数量的研究采用了深层神经网络。然而,研究采用了经过训练的模型,只计算一种昆虫,使用在受控环境中捕获的图像,这与实际情况大不相同。为了获得较高的精度,我们评估了三种卷积神经网络(CNN)模型,原创 2021-09-23 14:18:52 · 617 阅读 · 0 评论 -
用卷积神经网络识别实际田间条件下茶叶病虫害(自然环境下拍摄的数据集不用太多预处理)
用卷积神经网络识别实际田间条件下茶叶病虫害Identification of tea foliar diseases and pest damage underpractical field conditions using a convolutional neural networkAbstract茶叶病变对茶树生长不利。它们的不利影响包括茶叶的进一步病害以及产量和利润的直接下降。因此,茶叶病变的早期检测和现场监测对于有效控制感染和防止产量进一步损失是必要的。在这项研究中,1,822幅茶叶图像带原创 2021-09-21 10:42:10 · 1547 阅读 · 1 评论 -
EfficientNet细节
一、模型 ScaleEfficientNet 的论文,解决的是如何科学的 Scale 模型的问题。什么叫做模型的 Scale ?当卷积模型的 baseline 确定后,通过增加网络的深度,网络的宽度和输入网络图像的分辨率,就能得到不同大小的神经网络。比如 ResNet18,ResNet50 和 ResNet101。为了帮助理解,机器学习中的算法来进行类比。对于 GBDT 算法,模型的整体形式是确定的(前向加法树模型),通过对 n_estimators 以及 max_depth 等超参数的选择,可以确原创 2021-09-17 20:31:47 · 102 阅读 · 0 评论 -
cleanlab(解决图像标记错误)
置信学习(confident learning,CL)是一种新兴的、具有原则性的框架,以识别标签错误、表征标签噪声并应用于带噪学习最大的优势:可以用于发现标注错误的样本!无需迭代,开源了相应的python包,方便地快速使用!在ImageNet中查找训练集的标签错误仅仅需要3分钟!可直接估计噪声标签与真实标签的联合分布,具有理论合理性。不需要超参数,只需使用交叉验证来获得样本外的预测概率。不需要做随机均匀的标签噪声的假设(这种假设在实践中通常不现实)。与模型无关,可以使用任意模型,不像众多带噪学习与原创 2021-09-17 19:33:43 · 818 阅读 · 0 评论 -
model Ensemble
投票法(Voting)投票法即我们常见的“少数服从多数”原则,我们可以统计在多个模型的分类结果, 哪个类别频数高,即选择哪个类别。假设有五个模型,则很难对某一数据的分类为1,1,1,2,2。则投票结果为1.平均法(Averaging)平均法在回归问题及含阈值调节的场景更多一些。它的主要操作是对于多个模型计算的结果求平均作为最终的结果。model Ensemble...原创 2021-09-17 19:27:05 · 189 阅读 · 0 评论 -
snapmix与Bi-Tempered Logistic Loss(自制数据集纯度不高效果好)
1、软投票和硬投票(0.1,0.2,0.4,0.3)3(0.1,0.3,045,0.25)3(0.3,0.5,0.1,0.1)2硬投票:谁输出类多就谁,上例为3软投票:每一类的概率输出值的平均值,哪个最大就是哪一类。2、snapmixSnapMix 的思想很简单,既然在生成label 的时候,直接在原图中以被cut 掉的面积作为权重不合理,那作者就针对这一不合理作出了改进。3、Bi-Tempered Logistic Loss训练数据集里的标签通常不会都是正确的,比如图像分类,如果有人原创 2021-09-14 16:36:24 · 366 阅读 · 0 评论 -
图像处理几种Trick
1、基础数据增强数据增强也叫数据扩增,意思是在不实质性的增加数据的情况下,让有限的数据产生等价于更多数据的价值。【1】几何变换类几何变换类即对图像进行几何变换,包括翻转,旋转,裁剪,变形,缩放等各类操作【2】 颜色变换类等常见的包括噪声、模糊、颜色变换、擦除、填充AutoAugment: Learning Augmentation Policies from Data一种自动搜索合适数据增强策略的方法AutoAugment,该方法创建一个数据增强策略的搜索空间,利用搜索算法选取适合特定数据集的原创 2021-09-14 16:27:31 · 235 阅读 · 0 评论 -
matlab查看RGB图像矩阵数值
1、代码%读取一张图片,并显示original_picture=imread('IMG_20210714_170105.jpg');subplot(2,2,1);imshow(original_picture);title('原始图像的直方图')%分别读取R、G、B的值,1代表R,2代表G,3代表Bimage_r=original_picture(:,:,1);image_g=original_picture(:,:,2);image_b=original_picture(:,:,3);原创 2021-09-06 10:33:32 · 1562 阅读 · 0 评论 -
具有自适应空间强度约束和隶属度链接的鲁棒模糊c均值聚类算法
a b s t r a c t实践证明,模糊C均值聚类方法是一种有效的图像分割方法。然而,对于噪声图像,FCM方法并不稳健且不太精确。提出了一种改进的FCM方法——FCM _ SICM法,用于噪声图像分割。首先,利用快速双边滤波获取局部空间和强度信息;其次,利用原始图像和双边滤波图像之间的绝对差值图像,差值图像和差值图像本身的倒数分别约束传统的FCM和局部空间和强度信息;最后,通过以平方对数形式对每个聚类内先前迭代计算的所有隶属度求和作为目标函数的分母来实现隶属度链接。实验表明,与现有的几种方法相比,该方原创 2021-09-04 18:40:06 · 314 阅读 · 0 评论 -
K-means 聚类算法的图像区域分割
1、结构2、特征向量exactvector()%提取像素点的特征向量exactvector()function vec=exactvecotr(img)%忽略某个参数输出(2009以后的版本开始使用),比如[m,n,~]=size(imageRGB);size得到imageRGB的行列数赋值给[m,n,~][m,n,~]=size(img);%zeros(M,N)就是生成M行N列的零矩阵。vec=zeros(m*n,3);%图像转成double形式img=double(img);for原创 2021-08-13 19:05:38 · 459 阅读 · 0 评论 -
自动划分-------训练集+验证集+测试集(code,自己设置比例)
1、准备原始文件上面5个文件夹里装的全是图片。2、新建一个new文件夹soybean-tensorflow-data-new这个文件夹里面是空的3、codeimport osimport randomfrom shutil import copy2def data_set_split(src_data_folder, target_data_folder, train_scale=0.6, val_scale=0.2, test_scale=0.2): ''' 读取源原创 2021-08-04 21:11:17 · 2371 阅读 · 0 评论 -
SegNet泛读
1、论文信息Segnet: A deep convolutional encoder-decoder architecture for image segmentation作者:Vijay Badrinarayanan; Alex Kendall; Roberto Cipolla单位:剑桥大学发表会议及时间:CVPR 2015 TPAMI 20172、编码器-解码器框架编码器结构编码器部分主要由普通卷积层和下采样层将特征图尺寸缩小,使其成为更低维的表征。目的是尽可能多的提取低级特征和高级特征原创 2021-07-13 16:04:59 · 132 阅读 · 0 评论 -
FCN训练(code)
0、整体代码结构1、代码import torch as timport torch.nn as nnimport torch.nn.functional as Ffrom torch import optimfrom torch.autograd import Variablefrom torch.utils.data import DataLoaderfrom datetime import datetimefrom dataset import LoadDatasetfrom ev原创 2021-07-12 22:30:40 · 147 阅读 · 0 评论 -
FCN模型和loss实现(code)
1、双线性插值方法定义import torch from torchvision import modelsfrom torch import nnimport torch.nn.functional as Fimport numpy as npdef bilinear_kernel(in_channels, out_channels, kernel_size): """Define a bilinear kernel according to in channels and out c原创 2021-07-12 22:16:51 · 413 阅读 · 0 评论 -
FCN数据预处理(code)
1、导包import pandas as pdimport osimport torch as timport numpy as npimport torchvision.transforms.functional as fffrom torch.utils.data import Datasetfrom PIL import Imageimport torchvision.transforms as transformsimport matplotlib.pyplot as plt #原创 2021-07-12 22:02:45 · 180 阅读 · 0 评论 -
自定义双向线性插值滤子(卷积核)code
1、双线性插值import torchimport torch.nn as nnimport numpy as npimport matplotlib.pyplot as pltimport cv2def Bilinear_interpolation (src, new_size): """使用双线性插值方法放大图像 para: src(np.ndarray):输入图像 new_size:(tuple): 目标尺寸 ret:原创 2021-07-12 21:48:50 · 244 阅读 · 0 评论 -
FCN论文细节
1、在以往的分割方法中两大类缺点【1】基于图像块的分割虽然常见,但是效率低,且往往需要前期或者后期处理(例如超像素、检测框、局部预分类等)【2】语义分割面临着语义和位置信息不可兼得的问题。全局信息解决的“是什么”,而局部信息解决的是“在哪里”2、创新点【1】将分类网络改编为全卷积神经网络,具体包括全连接层转化为卷积层以及通过反卷积进行上采样。【2】使用迁移学习的方法进行微调。【3】使用跳跃结构使得语义信息可以和表征信息相结合,产生准确而精细的分割。3、全局信息与局部信息局部信息提取位置:原创 2021-07-12 21:38:05 · 111 阅读 · 0 评论 -
FCN论文-语义分割
1、语义分割语义分割是计算机视觉中的关键任务之一。现实中,越来越多的应用场景需要从影像中推理出相关的知识或语义(即由具体到抽象的过程)。作为计算机视觉的核心问题,语义分割对于场景理解的重要性日渐突出。2、语义分割研究现状(1)传统方法:Normalized cut 、Structured Random Forests 、SVM···(2)深度学习卷积神经网络: FCN、 SegNet 、 LinkNet···3、传统方法代表问题在实际运用中,每运行一次 Ncut,只能切割一次图片,为了分割原创 2021-07-12 20:43:28 · 373 阅读 · 0 评论 -
SENet实验
1、pycharm结构2、01_parse_cifar10_to_png.pyimport numpy as npimport osimport sysimport pickleimport imageioBASE_DIR = os.path.dirname(os.path.abspath(__file__))def unpickle(file): fo = open(file, 'rb') if sys.version_info < (3, 0):原创 2021-06-19 20:21:33 · 114 阅读 · 0 评论 -
SENet细节
1、Squeeze: Global Information EmbeddingSqueeze操作:采用全局池化.即 压缩H和W至1*1,利用1个像素来 表示一个通道,实现低维嵌入。2、Excitation: Adaptive Recalibration公式(3)中,第一个全连接层的激活函数为ReLU:第二个全连接 层激活函数为Sigmoid重要的参数:reduction ratio r控制第一个全连接层神经元个数,进而影响SE Block的参数量。关于r的有对比实验,经验值为163、SE B原创 2021-06-19 14:58:06 · 253 阅读 · 0 评论 -
SENet(ILSVRC2017-最后一个冠军)
1、论文信息Squeeze-and-Excitation NetworksJieHu&LiShen等Momenta & University of Oxford (VGG组)CVPR20182、论文背景【1】CVPR 2018引用第一的论文【2】ILSVRC 2017分类冠军 cifar-10/100, Places365, COCO, ImageNet-l K数据集均超越主流模型【3】较早的将注意力机制引入卷积神经网络, 并且该机制是一种即插即用的模块,可嵌 入任意主流的卷原创 2021-06-19 14:10:49 · 368 阅读 · 1 评论 -
DenseNet实验
1、pycharm结构2、01_parse_cifar10_to_png.pyimport numpy as npimport osimport sysimport pickleimport imageioBASE_DIR = os.path.dirname(os.path.abspath(__file__))def unpickle(file): fo = open(file, 'rb') if sys.version_info < (3, 0):原创 2021-06-18 16:51:08 · 146 阅读 · 0 评论 -
DenseNet细节
1、组件Dense connectivity稠密连接:在一个Block中,每一层的输入来自于它前面所有层的特征图,每一层的输出均会直接连接到它后面所有层的输入。1+2+3+4+5=5*(5+1)/2=15优点:【1】用较少参数获取更多特征,减少了参数。【2】低级特征得以复用,特征更加丰富。【3】更强的梯度流动,跳层连接更多,梯度可更容易向前传播。pooling layer池化层用于降低特征图分辨率,DenseNet将特征图分辨率下降称为transition layer ,由BN、11卷原创 2021-06-18 16:20:43 · 72 阅读 · 0 评论 -
DenseNet论文
1、论文信息Densely Connected Convolutional Networks稠密连接的卷积神经网络Gao Huang&Zhuang Liu等Cornell University Tsinghua UniversityCVPR2017 (Best Paper)研究内容:提出Densenet ,其中的每一层会作为其后一层的输入层。对于L层的网络,传统方法有L层连接,而DenseNet有L*(L+1)/2个连接,因此得名DenseNet优点:减轻梯度消失,争强特征传播,加强特原创 2021-06-18 14:53:41 · 283 阅读 · 0 评论 -
resnext实验
1、pycharm结构2、相关代码import osfrom datetime import datetimeimport numpy as npimport torch.nn as nnimport torchfrom torch.utils.data import DataLoaderimport torchvision.transforms as transformsimport torch.optim as optimfrom lesson.H_ResNeXt.tools.ci原创 2021-06-16 21:32:26 · 107 阅读 · 0 评论 -
ResNeXt结构(code)
1、PyTorch中ResNeXt50_32x4d 结构定义基础模块定义:33卷积, 11卷积, Bottleneck Blockimport torchimport torch.nn as nn#定义模块对外暴露的接口__all__ = ['ResNet', 'resnet18', 'resnet34', 'resnet50', 'resnet101', 'resnet152', 'resnext50_32x4d', 'resnext101_32x8d',原创 2021-06-16 21:17:01 · 268 阅读 · 0 评论 -
resnext50_32x4d-inference
1、导包import osBASE_DIR = os.path.dirname(os.getcwd())os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8'import syssys.path.append(BASE_DIR)import timeimport jsonimport torchimport torchvision.transforms as transformsimport torchvision.models原创 2021-06-16 20:49:39 · 613 阅读 · 0 评论 -
ResNeXt核心思想
1、聚合变换一个神经元的操作Splitting: X分解为D个元素,可理解为低维嵌入Transforming:每个元素进行变换,此处仅做乘法Aggregating:对D个变换后的结果进行聚合(求和)Inception:split-transform-mergBlock中的聚合变换Splitting: 通过1*1卷积实现低维嵌入,256通道变成4个通道,总共32个分支(cardinality=32)。Transforming:每个分支进行变换(用网络层对数据操作)Aggregati原创 2021-06-16 20:30:55 · 145 阅读 · 0 评论