深度学习--图像分类
文章平均质量分 55
东华果汁哥
大家好!我叫赖德发,欢迎您来到我的博客。
展开
-
【深度学习--图像分类】基于深度学习的图像分类技术
无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。人工智能教程...原创 2019-08-02 21:07:26 · 14575 阅读 · 6 评论 -
【深度学习 图像分类】图像分类任务细节
实现一个完整的图像分类任务,大致需要分为五个步骤:1、选择开源框架目前常用的深度学习框架主要包括tensorflow、keras、pytorch、mxnet,caffe等;2、构建并读取数据集根据任务需求搜集相关图像搭建相应的数据集,常见的方式包括:网络爬虫、实地拍摄、公共数据使用等。随后根据所选开源框架读取数据集。3、框架搭建选择合适的网络模型、损失函数以及优化方式,以完成整体框架的...原创 2019-09-10 11:34:41 · 2629 阅读 · 0 评论 -
【深度学习 transformer】Transformer与ResNet50在自定义数据集图像分类中的效果比较
ResNet50是一个具有50层的深度残差网络,通过引入残差连接来解决深层网络训练中的梯度消失问题。其结构允许网络学习到更复杂的特征,并在多个图像分类任务中表现出色。在我们的实验中,ResNet50在自定义数据集上的表现优于Transformer。数据量:自定义数据集的规模可能不足以发挥Transformer的优势。模型设计:ResNet50针对图像分类进行了优化,而Transformer仍在不断改进以适应视觉任务。原创 2024-09-20 11:28:58 · 638 阅读 · 0 评论 -
【深度学习 Transformer】训练 Vision Transformer (ViT) 进行图像分类:不使用预训练模型
Vision Transformer (ViT) 是一种将自然语言处理中大放异彩的 Transformer 架构应用于计算机视觉任务的模型。ViT 通过将图像分割成多个小块(patches),然后将这些小块视为序列数据输入到 Transformer 模型中,从而实现对图像的分类和其他视觉任务。原创 2024-09-19 16:42:31 · 927 阅读 · 0 评论 -
【深度学习 Transformer VIT】Transformer VIT:拆解“视觉变形金刚”,笑谈技术细节
话说在深度学习江湖,卷积神经网络(CNN)一直是视觉识别任务的“老大哥”。但这位老大哥有时候也会遇到难题,比如处理复杂场景和大规模数据时,就显得有点力不从心。就在这时,一位名叫Transformer VIT的“侠客”横空出世,它借鉴了自然语言处理领域的Transformer架构,立志要改变视觉识别的江湖格局。今天咱们来点不一样的,用幽默的方式解读一下那个让计算机视觉界为之疯狂的模型——Transformer VIT。标题:Transformer VIT:拆解“视觉变形金刚”,笑谈技术细节。原创 2024-09-13 17:20:58 · 579 阅读 · 0 评论 -
【深度学习 计算机视觉】计算机视觉工程师所需的和有帮助的基本技能
计算机视觉是一个广泛且活跃的研究领域,有许多有趣且具有挑战性的项目适合练手。原创 2024-09-05 10:42:15 · 1334 阅读 · 0 评论 -
【深度学习 卷积】利用ResNet-50模型实现高效GPU图片预测
ResNet-50作为一种经典的CNN模型,以其强大的特征提取能力和较高的预测准确率,在众多领域得到了广泛应用。本文详细介绍了如何使用训练好的ResNet-50模型进行图片预测。ResNet-50模型包含50个卷积层,分为四个阶段,每个阶段包含多个残差块。本文介绍了如何使用训练好的ResNet-50模型进行图片预测。(2)替换模型的最后三层(全局平均池化层、全连接层和softmax层),以适应新的分类任务;使用预训练的ResNet-50模型作为基础,在训练集上对模型进行微调。原创 2024-09-04 15:53:45 · 582 阅读 · 0 评论 -
【CNN 4个系列网络】 图像分类4 个系列模型值得一看
InceptionV3是 Google 对 InceptionV2 的一种改进。首先,InceptionV3 设计和使用了更多种类的Inception 模块,部分 Inception 模块将较大的方形二维卷积拆成两个较小的非对称卷积,从而大幅度节省参数量;GhostNet是华为于 2020 年提出的一种全新的轻量化网络结构。通过引入 Ghostmodule,大大缓解了传统深度网络中特征的冗余计算问题,使得网络的参数量和计算量大大降低;ResNeSt系列模型是 2020 年提出的。在原有的 ResN.原创 2020-12-30 10:24:23 · 1443 阅读 · 0 评论 -
【深度学习 图像预处理】深度学习的图像预处理每个图片减去均值
做深度学习图片预处理的时候,每个图片都要减去均值,原因是为什么呢?原因如下:在图像送入网络训练之前,减去图片的均值,这算是一种归一化操作,那为什么一定要做这个归一化操作呢。其主要的原因就是对于我们的图像其实是一种平稳的分布,减去数据对应维度的统计平均值,来消除公共部分。以凸显个体之前的差异和特征。...原创 2019-11-07 17:18:37 · 1900 阅读 · 0 评论 -
【git-lfs 安装教程】10分钟了解Git LFS
查看:output_graph.pb 内容如下:version https://git-lfs.github.com/spec/v1oid sha256:fe2653775a6e9a601a7ee377aeb1881e867c19a3be7f5776acf5c3512d1f2c64size 87434170进一步了解到这是通过git lfs 上传的大文件,那么如下下载他呢,答案便是安装g...原创 2019-09-17 18:54:51 · 9895 阅读 · 6 评论 -
【深度学习--图像分类】imageAI自定义模型预测
ImageAI 提供4种不同的算法和模型,使你可以用您自定义的模型执行图像预测。您将使用 ImageAI 已训练的模型和相应的 JSON 文件来预测自定义对象。下面我们通过我们训练的一个例子来进行预测。先看项目目录:datasetresnet_train.pyresnet_predict.py模型分为5类,训练好的模型最高测试集准确率97.48%左右。dataset 文件夹下面结构...原创 2019-09-26 20:02:47 · 2300 阅读 · 2 评论 -
【深度学习--图像分类】imageAI自定义模型训练
10分钟了解下图像识别库imageAI,请看上篇文章。点这里ImageAI 提供4种不同的算法及模型来执行自定义预测模型训练,通过以下简单几个步骤即可实现自定义预测模型训练。提供用于自定义预测模型训练的4种算法包括 SqueezeNet,ResNet,InceptionV3 和 DenseNet。您可以将其中一种算法加载到imageai.Prediction.Custom.CustomImage...原创 2019-09-26 19:28:12 · 2924 阅读 · 0 评论 -
【深度学习--图像分类】10分钟了解下图像识别库imageAI
ImageAI 提供4种不同的算法及模型来执行图像预测,通过以下简单几个步骤即可对任何图片执行图像预测。提供用于图像预测的4种算法包括 SqueezeNet,ResNet,InceptionV3 和 DenseNet。这些算法中的每一个都有单独的模型文件,您必须根据所选算法使用相对应的模型文件,请单击以下链接下载所选算法的模型文件:SqueezeNet(文件大小:4.82 MB,预测时间最短,...原创 2019-09-25 20:44:57 · 3241 阅读 · 2 评论 -
【图像分类--图片数据扩充】图片数据不够怎么凑
在训练神经网络的过程中,为了能够使训练的网络有更高的准确率,更低的过拟合,通常需要大量的训练数据,但在实际工作中,大量数据并不是说有就有的,怎么办呢,通常解决这个问题的办法就是,使用一些手段,人为扩充数据集。本篇文章,将针对图像数据,提供一些扩展常用方法,相信这些方法能够满足大家对扩充图片数据集的需求。方法1:利用keras生成器扩充图片数据集。# -*- coding: utf-8 -*-...原创 2019-09-24 22:50:40 · 8837 阅读 · 12 评论