![](https://img-blog.csdnimg.cn/20190918140012416.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
深度学习
文章平均质量分 87
深度学习
金戈鐡馬
这个作者很懒,什么都没留下…
展开
-
基于深度学习的图像超分辨率应用
超分辨率卷积神经网络 (SRCNN)SRCNN 是一种开创性的深度学习模型,专为单幅图像超分辨率任务而设计。它以低分辨率图像作为输入,并学习低分辨率图像和高分辨率图像之间的端到端映射。该网络由三个卷积层组成,每个卷积层负责一个特定的任务:补丁提取、非线性映射和重建。概括:单幅图像超分辨率的端到端学习,三层架构。生成对抗网络 (GAN)GAN 由一个生成器和一个鉴别器网络组成,它们在两人极小极大游戏中竞争。生成器创建合成图像,而鉴别器则试图区分真实图像和生成图像。原创 2023-11-27 00:34:27 · 351 阅读 · 0 评论 -
基于SRGAN的人脸图像超分辨率
GAN可以生成“真实”的图像, 那么当“真实的图像”是清晰的图像时,也意味着GAN可以生成清晰的图像。除了第一个卷积和上采样层中的卷积,每个卷积后面都有BN(其实,BN在SR中没有效果甚至略差,SR输入和输出有相似的空间分布,而BN白化中间的特征的方式完全破坏了原始空间的表征,因此需要部分参数来恢复这种表征,所以同样多的参数,有BN的还要拿出一部分参数做恢复,效果就差了点)。相对SRResNet来说,SRGAN不那么平滑,但是有些细节并不准确,更像是噪声,而且有时会出现奇怪的东西,例如额头上的亮光。原创 2023-11-25 00:55:12 · 348 阅读 · 0 评论 -
超分辨率重建
客观世界的场景含有丰富多彩的信息,但是由于受到硬件设备的成像条件和成像方式的限制,难以获得原始场景中的所有信息。而且,硬件设备分辨率的限制会不可避免地使图像丢失某些高频细节信息。在当今信息迅猛发展的时代,在卫星遥感、医学影像、多媒体视频等领域中对图像质量的要求越来越高,人们不断寻求更高质量和更高分辨率的图像,来满足日益增长的需求。空间分辨率的大小是衡量图像质量的一个重要指标,也是将图像应用到实际生活中重要的参数之一。分辨率越高的图像含有的细节信息越多,图像清晰度越高,在实际应用中对各种目标的识别和判断也原创 2023-11-25 00:54:46 · 648 阅读 · 0 评论 -
一文带你了解机器翻译的前世今生
如果你要求谷歌将格鲁吉亚语翻译成泰莱古语,它必须在内部将其翻译成英语作为中间步骤,因为没有足够多的格鲁吉亚语到泰莱古语的翻译来证明在该语言对上投入大量资金是合理的。例如,我们可能会测量每只耳朵的大小或两只眼睛之间的间距,然后比较两张照片中的这些测量值,看看他们是否是同一个人。对语言翻译几乎一无所知的深度学习研究人员正在拼凑相对简单的机器学习解决方案,这些解决方案正在击败世界上最好的专家构建的语言翻译系统。现在比较两张不同的脸要容易得多,因为我们只需要比较每张脸的这 128 个数字,而不是比较完整的图像。原创 2023-11-27 00:33:55 · 332 阅读 · 0 评论 -
如何从Pytorch中导出ONNX模型并使用它实现图像超分
在本教程中,我们将介绍如何将 PyTorch 中定义的模型转换为 ONNX 格式,然后使用 ONNX 运行时运行它。ONNX 运行时是面向 ONNX 模型的以性能为中心的引擎,可跨多个平台和硬件(Windows、Linux 和 Mac)以及 CPU 和 GPU 进行高效推理。ONNX 运行时已被证明可以显著提高多个模型的性能,如此处所述。对于本教程,您需要安装 ONNX 和 ONNX 运行时。可以使用获取 ONNX 和 ONNX 运行时的二进制生成。原创 2023-08-04 08:00:00 · 620 阅读 · 0 评论 -
Tensorflow卷积神经网络
卷积是图像处理中一种基本方法. 卷积核是一个f*f的矩阵. 通常n取奇数,使得卷积核有中心点.对图像中每个点取以其为中心的f阶方阵, 将该方阵中各值与卷积核中对应位置的值相乘, 并用它们的和作为结果矩阵中对应点的值.卷积核每次向右移动1列, 遇行末向下移动1列直到完成所有计算. 我们把每次移动的距离称为步幅s.上述操作处理图像得到新图像的操作称为卷积, 在图像处理中卷积核也被称为过滤器(filter).原创 2023-04-30 00:15:00 · 631 阅读 · 1 评论 -
ChatGPT技术与市场动态
ChatGPT发布之后,引发了全球范围的关注和讨论,国内各大厂商相继宣布GPT模型开发计划。据各公司官网,2023年2月7日,百度宣布将推出ChatGPT类似产品“文心一言”,预计今年3月展开内测;2月8日阿里宣布阿里版ChatGPT正在研发中,目前处于内测阶段;2月9日,字节跳动旗下AI Lab宣布正在开展ChatGPT和AIGC相关研发,未来将为PICO提供技术支持;2月10日,京东旗下言犀人工智能平台推出产业版ChatGPT—“ ChatJD”。AI模型对算力的需求主要体现在训练和推理两个层面。当前主原创 2023-03-03 00:23:43 · 12906 阅读 · 0 评论 -
CVPR应用 —— 老照片修复
随手整理电脑里的照片,望着一张物是人非的老相片,勾起了斑驳的回忆。忽尔转念一想,何不 PS 下,但 Photoshop 有些大且不免费自己懒得装,于是,转向免费的图像复原软件。网上搜来找去,却一直没寻到合适的,最后查到 CVPR 2020 的一篇 Oral 论文,看到有的博客已经详细介绍过了,恰好作者也开放了源码,于是,一时兴起,拍脑门决定,就拿这个来复原老相片吧。原创 2023-04-19 00:15:00 · 363 阅读 · 0 评论 -
基于U2-Net如何训练一个一键抠图模型
抠图是图像编辑的基础功能之一,在抠图的基础上可以发展出很多有意思的玩法和特效。比如一键更换背景、一键任务卡通化、一键人物素描化等。正是因为这些有意思的玩法,CVPy网站上的一键抠图功能上线以来,从赞数来看,人气之高已经遥遥领先于CV派内其他高手,可见此模型的受欢迎程度。笔者最近也是对此模型背后的网络很感兴趣,收集数据训练了人脸素描化模型,尽管受限于数据集,只能在人脸图片上转换成功,但自己仍然玩的不亦乐乎。原创 2023-11-29 00:34:58 · 1170 阅读 · 1 评论 -
大模型训练为什么用A100不用4090
把他的成本打开,SXM 的成本不会高于 300,封装的及大约也需要300,中间的 Logic Die 最大颗,看上去最高贵 :) 那是 4nm 的一颗 814mm2 的 Die,TSMC 一张 12 英寸 Wafer 大致上可以制造大约 60 颗这个尺寸的 Die,Nvidia 在 Partial Good 上一向做得很好(他几乎不卖 Full Good),所以这 60 颗大致能有 50 颗可用,Nvidia 是大客户,从 TSMC 手上拿到的价格大约是 ,所以这个高贵的大约只需要300。原创 2023-11-29 00:34:10 · 3756 阅读 · 1 评论 -
使用C++从0到1实现人工智能神经网络及实战案例
神经网络中的计算几乎都可以用矩阵计算的形式表示,这也是我用OpenCV的Mat类的原因之一,它提供了非常完善的、充分优化过的各种矩阵运算方法;f就是我们一直说的激活函数。可以看到已经有了训练的函数train()、测试的函数test(),还有实际应用训练好的模型的predict()函数,以及保存和加载模型的函数save()和load()。的作用是,检验下转换后的矩阵和标签是否对应正确这里是把col(3),也就是第四个样本从一行重新变成28x28的图像,看上面的第一张图的第一列可以看到,第四个样本的标签是4。原创 2023-11-24 00:05:19 · 2518 阅读 · 0 评论 -
深度学习中对抗生成网络GAN背后的数学原理
那么,GAN究竟是什么呢?可以理解成是非常复杂的分布,不可能用某个数学表达精确表示,因此我们只能通过抽象,使用一个具体的分布模型。此时,D就是可以使用一个神经网络作为二分类器,那么确定D,也就是可以使用梯度下降来优化获得D的最终参数。G和D的训练过程交替进行,这个对抗的过程使得G生成的图像越来越逼真,D“打假”的能力也越来越强。GAN的最大的创新就是在于非常精妙地引入了判别器,从样本的维度解决了衡量两个分布差异的问题。的KL散度尽可能低,也就是使得两者的分布尽可能接近,实现用确定的分布。原创 2023-11-19 00:40:13 · 375 阅读 · 0 评论 -
神经网络反向传播的数学原理
如果能二秒内在脑袋里解出下面的问题,本文便结束了。已知:,其中。求:。到这里,请耐心看完下面的公式推导,无需长久心里建设。首先,反向传播的数学原理是“” :设f和g为x的可导函数,则。接下来介绍这一节展示如何使用链式法则、转置、组合等技巧来快速完成对矩阵、向量的求导一个原则,实质是基本知识,没有在课本中找到下列内容,:通过。利用维数相容原则解上例:step1:把所有参数当做实数来求导,依据链式法则有可以看出除了和的求导结果在维数上连矩阵乘法都不能满足。原创 2023-11-19 00:42:27 · 190 阅读 · 0 评论 -
图神经网络的数学原理总结
图深度学习(Graph Deep Learning) 多年来一直在加速发展。许多现实生活问题使GDL成为万能工具:在社交媒体、药物发现、芯片植入、预测、生物信息学等方面都显示出了很大的前景。本文将流行的图神经网络及其数学细微差别的进行详细的梳理和解释,图深度学习背后的思想是学习具有节点和边的图的结构和空间特征,这些节点和边表示实体及其交互。原创 2023-11-24 00:08:33 · 225 阅读 · 0 评论 -
图神经网络与图注意力网络
随着计算机行业和互联网时代的不断发展与进步,图神经网络已经成为人工智能和大数据的重要研究领域。图神经网络是对相邻节点间信息的传播和聚合的重要技术,可以有效地将深度学习的理念应用于非欧几里德空间的数据上。本期推送围绕图神经网络与图注意力网络相关知识进行概述。原创 2023-11-23 00:14:42 · 572 阅读 · 0 评论 -
图神经网络入门基础
图中的节点是用户和商家,用户和商家都有各自的特征,除了特征还有与他人的交互,也就是边关系,传统的方法是通过用户和商家的特征来训练一个分类网络,通过图学习,我们不仅可以学习到节点的特征,还可以学习到节点之间的交互关系,以及图结构的关系,以此来进行分类,从而找到金融诈骗分子。在以往的深度学习中,使用的训练数据有语音,文本,和图像,他们一般都是结构性数据,有整齐规则的数据结构,例如,文本是一维的文字排列,语音是一维音频信号排列,图像是二维像素排列。图是一种描述复杂事物的语言,那图有什么实际的应用呢?原创 2023-11-22 05:55:08 · 185 阅读 · 0 评论 -
什么是图神经网络
GCN的工作启发了莱斯科维奇和他的两名斯坦福研究生,以此创建了GraphSage,这是一个GNN,展示了消息传递功能的新工作方式。它们可以采用任何形状或大小,并包含任何类型的数据,包括图像和文本。LinkedIn的高级软件工程师Jaewon Yang在研讨会上的另一个小组上表示,LinkedIn使用GNN进行社交推荐,并探索人们的技能与职位之间的关系。在GNN中,数据点被称为节点,连接这些点的线被称为边,将上述概念使用数学元素进行表达,机器学习算法就可以在节点、边或整个图的层次上做出有用的预测。原创 2023-11-22 05:54:34 · 132 阅读 · 0 评论 -
什么是强化学习
强化学习(reinforcement learning,RL) 讨论的问题是智能体(agent)怎么在复杂、不确定的环境(environment)中最大化它能获得的奖励。如图 1.1 所示,强化学习由两部分组成:智能体和环境。在强化学习过程中,智能体与环境一直在交互。智能体在环境中获取某个状态后,它会利用该状态输出一个动作 (action),这个动作也称为决策(decision)。然后这个动作会在环境中被执行,环境会根据智能体采取的动作,输出下一个状态以及当前这个动作带来的奖励。原创 2023-11-21 09:46:49 · 3314 阅读 · 0 评论 -
什么是深度学习
图灵测试是人工智能是否真正能够成功的一个标准,“计算机科学之父”、“人工智能之父”英国数学家图灵在1950年的论文《机器会思考吗》中提出了图灵测试的概念。即把一个人和一台计算机分别放在两个隔离的房间中,房间外的一个人同时询问人和计算机相同的问题,如果房间外的人无法分别哪个是人,哪个是计算机,就能够说明计算机具有人工智能。原创 2023-11-21 09:46:30 · 336 阅读 · 0 评论 -
详解深度学习中的图神经网络GNN
前面我们说过节点,边,图的属性就是一堆向量,也就是前面说的表格数据,处理向量用MLP就可以了,当然你也可以用其他网络,如上图,节点,边,图各有一个MLP,所有点参数共享,也就是所有点共用一个MLP,所有边共用一个MLP。声音文本这类时序数据,用RNN类型的网络最适合,但如果你把一个句子当作一个1*N的矩阵,那就可以用CNN处理了,只不过,CNN需要堆叠多个层来抓取时序数据中的上下文信息,这在图像领域被称为感受野。GNN预测图中每一个节点的属性,例如,下图,预测社交网络中的成员是否是诈骗分子。原创 2023-11-23 01:30:53 · 1261 阅读 · 0 评论 -
PyTorch 实战之水果分类
当我们试图提高神经网络的准确性时,经常会遇到过拟合训练数据的情况。当我们运行测试数据的模型时,这会导致一个糟糕的预测。因此,我采取了一个数据集,并应用这些技术,不仅提高准确性,而且还处理过拟合的问题。在本文中,我们将使用以下技术在不到5分钟的时间内训练一个最先进的模型,以达到从 Fruit 360数据集中分类图像的95% 以上的准确率:数据增强数据分析中的数据增强是通过对现有数据或从现有数据中新创建的合成数据进行稍加修改的“副本”来增加数据量的技术。在训练机器学习模型时,它起到调节器的作用,有助于减少过拟合原创 2023-11-18 13:40:06 · 1109 阅读 · 1 评论 -
提取图像文本的 5 大 Python 库
它由编码器和解码器组成:TrOCR使用预训练的图像变换器作为编码器和预训练的文本变换器作为解码器。这与先前的库不同,它返回一个无意义的数字。要解决OCR任务,首先需要检测图像中的对象,然后提取输入中的文本。正如您所注意到的,它估算了每个字符的边界框,而不是每个单词!如果考虑到非英语语言,EasyOCR可能是最适合的选择,因为它具有更广泛的语言覆盖和更好的性能。然后,我们导入使用docTR的相关库并加载模型,它是一个两步方法。在本文中,我将展示一些Python库,可以让您轻松从图像中提取文本,无需太多麻烦。原创 2023-11-20 10:40:31 · 1111 阅读 · 1 评论 -
目标检测标注工具AutoDistill
AutoDistill 是一个具有开创性的开源项目,旨在彻底改变监督学习的过程。该工具利用大型、较慢的基础模型来训练较小、更快的监督模型,使用户能够从未标记的图像直接转到在边缘运行的自定义模型上进行推断,无需人工干预。原创 2023-11-17 02:05:25 · 1013 阅读 · 1 评论 -
基于Pytorch的从零开始的目标检测
目标检测是计算机视觉中一个非常流行的任务,在这个任务中,给定一个图像,你预测图像中物体的包围盒(通常是矩形的) ,并且识别物体的类型。我们使用 ImageNet 统计数据对图像进行标准化,因为我们使用的是预训练的 ResNet 模型并在训练时在我们的数据集中应用数据增强。由于训练一个计算机视觉模型需要的图像是相同的大小,我们需要调整我们的图像和他们相应的包围盒。数据增强是一种通过使用现有图像的不同变体创建新的训练图像来更好地概括我们的模型的技术。将边界框转换为与其对应的图像大小相同的图像(称为掩码)。原创 2023-11-18 00:17:44 · 565 阅读 · 0 评论 -
基于 Keras 的图像分类器
深度学习是使用人工神经网络进行机器学习的一个子集,目前已经被证明在图像分类方面非常强大。尽管这些算法的内部工作在数学上是严格的,但 Python 库(比如 keras)使这些问题对我们所有人都可以接近。在本文中,我将介绍一个简单的图像分类器的设计,它使用人工神经网络将食物图像分为两类:披萨或意大利面。原创 2023-11-15 10:12:26 · 241 阅读 · 0 评论 -
基于PyTorch搭建你的生成对抗性网络
你听说过GANs吗?还是你才刚刚开始学?GANs是2014年由蒙特利尔大学的学生 Ian Goodfellow 博士首次提出的。GANs最常见的例子是生成图像。有一个网站包含了不存在的人的面孔,便是一个常见的GANs应用示例。也是我们将要在本文中进行分享的。生成对抗网络由两个神经网络组成,生成器和判别器相互竞争。我将在后面详细解释每个步骤。希望在本文结束时,你将能够从零开始训练和建立自己的生财之道对抗性网络。所以闲话少说,让我们开始吧。目录步骤0: 导入数据集步骤1: 加载及预处理图像。原创 2023-11-15 10:11:57 · 1512 阅读 · 0 评论 -
YOLOv8模型ONNX格式INT8量化轻松搞定
学会用C++部署YOLOv5与YOLOv8对象检测,实例分割,姿态评估模型,TorchVision框架下支持的Faster-RCNN,RetinaNet对象检测、MaskRCNN实例分割、Deeplabv3 语义分割模型等主流深度学习模型导出ONNX与C++推理部署,轻松解决Torchvision框架下模型训练到部署落地难题。深度学习模型量化支持深度学习模型部署框架支持的一种轻量化模型与加速模型推理的一种常用手段,ONNXRUNTIME支持模型的简化、量化等脚本操作,简单易学,非常实用。原创 2023-11-11 10:06:45 · 5726 阅读 · 14 评论 -
详解卷积神经网络结构
卷积神经网络是以卷积层为主的深度网路结构,网络结构包括有卷积层、激活层、BN层、池化层、FC层、损失层等。卷积操作是对图像和滤波矩阵做内积(元素相乘再求和)的操作。1. 卷积层卷积操作解释图解标准卷积一般采用3x3、5x5、7x7的卷积核进行卷积操作。分组卷积将输入特征图按通道均分为 x 组,然后对每一组进行常规卷积,最后再进行合并。空洞卷积。原创 2023-11-09 11:42:40 · 436 阅读 · 0 评论 -
深度学习检测小目标常用方法
本文比较详细地总结了一些在通用目标检测和专门人脸检测领域常见的小目标检测的解决方案,后面有时间会再写一些专门在人脸领域的困难点(比如ROP的侧脸,RIP的360度人脸)及现在学术界的解决方案。原创 2023-11-10 08:56:29 · 395 阅读 · 0 评论 -
CNN入门实战:猫狗分类
CNN(Convolutional Neural Network,卷积神经网络)是一种深度学习模型,特别适用于处理图像数据。它通过多层卷积和池化层来提取图像的特征,并通过全连接层进行分类或回归等任务。CNN在图像识别、目标检测、图像分割等领域取得了很大的成功。目标分类是指识别图像中的物体,并将其归类到不同的类别中。例如,猫狗分类就是一个目标分类的任务,CNN可以帮助我们构建一个模型来自动识别图像中的猫和狗。如何入门CNN要入门CNN,可以先了解深度学习的基本概念和原理,然后学习如何构建和训练CNN模型。原创 2023-11-08 16:05:32 · 1043 阅读 · 0 评论 -
卷积神经网络中 6 种经典卷积操作
深度学习的模型大致可以分为两类,一类是卷积神经网络,另外一类循环神经网络,在计算机视觉领域应用最多的就是卷积神经网络(CNN)。CNN在图像分类、对象检测、语义分割等经典的视觉任务中表现出色,因此也早就有一大批各种各样的经典卷积神经网络模型与一些鬼斧神工的卷积操作,今天小编就斗胆总结一波这些经典的卷积操作都有哪些?(不完全版本,欢迎补充….)原创 2023-11-07 21:00:04 · 2204 阅读 · 0 评论 -
基于CodeFormer使用C++实现图片模糊变清晰,去除马赛克等效果
CodeFormer是一种基于AI技术深度学习的人脸复原模型,由南洋理工大学和商汤科技联合研究中心联合开发。该模型通过结合了VQGAN和Transformer等技术,可以通过提供模糊或马赛克图像来生成清晰的原始图像。可以实现老照片修复、照片马赛克修复、黑白照片彩色化、低码率视频增强,增加细节等效果。原创 2023-10-14 12:49:42 · 1145 阅读 · 2 评论 -
生成对抗网络入门案例
生成对抗网络(Generative Adversarial Networks,简称GANs)是一种用于生成新样本的机器学习模型。它由两个主要组件组成:生成器(Generator)和判别器(Discriminator)。生成器尝试生成与训练数据相似的新样本,而判别器则试图区分生成器生成的样本和真实训练数据。原创 2023-10-05 08:00:00 · 1097 阅读 · 0 评论 -
基于Dlib训练自已的人脸数据集提高人脸识别的准确率
由于图像的质量、光线、角度等因素影响。这时如果使用官方提供的模型做人脸识别,就会导至识别率不是很理想。人脸识别的准确率与图像的清晰度和质量有关。如果图像模糊、光线不足或者有其他干扰因素,Dlib 可能无法正确地识别人脸。为了确保图像质量良好,可以使用更清晰的图像、改善光照条件或使用图像增强技术来提高图像质量。但这些并不是本篇章要讲述的内容。那么除去图像质量和光线不足等因素,如何解决准确率的问题呢?答案就是需要自已收集人脸并进行训练自已的识别模型。原创 2023-09-29 20:18:11 · 1762 阅读 · 3 评论 -
Dlib中matrix<float, 0, 1>矩阵的理解
matrix是 Dlib 中表示一个浮点数矩阵的数据结构。这个数据结构用于存储特征向量,其中每个元素都是一个浮点数。在 Dlib 中,matrix是一个多维数组的模板类,可以用来表示不同类型的矩阵。在这种情况下,float是矩阵中元素的类型,0表示矩阵的行数可以根据需要动态调整,1表示矩阵的列数固定为 1。你可以使用matrix来创建一个特征向量,并对其进行操作,例如计算欧氏距离或进行其他数学运算。原创 2023-09-28 18:58:58 · 604 阅读 · 0 评论 -
OCR端到端不定长文字识别CRNN算法详解
在以前的OCR任务中,识别过程分为两步:单字切割和分类任务。我们一般都会讲一连串文字的文本文件先利用投影法切割出单个字体,在送入CNN里进行文字分类。但是此法已经有点过时了,现在更流行的是基于深度学习的端到端的文字识别,即我们不需要显式加入文字切割这个环节,而是将文字识别转化为序列学习问题,虽然输入的图像尺度不同,文本长度不同,但是经过DCNN和RNN后,在输出阶段经过一定的翻译后,就可以对整个文本图像进行识别,也就是说,文字的切割也被融入到深度学习中去了。原创 2023-03-14 15:13:36 · 936 阅读 · 0 评论 -
OCR端到端不定长文本识别CRNN代码实现
CRNN是OCR领域非常经典且被广泛使用的识别算法,CNN采取了经典的VGG16,值得注意的是,在VGG16的第3第4个max pooling层CRNN采取的是1×2的矩形池化窗口(w×h),这有别于经典的VGG16的2×2的正方形池化窗口,这个改动是因为文本图像多数都是高较小而宽较长,所以其feature map也是这种高小宽长的矩形形状,如果使用1×2的池化窗口则更适合英文字母识别(比如区分i和l)。原创 2023-03-14 15:01:56 · 674 阅读 · 1 评论 -
TNN API说明文档
TNN 是一个移动端高性能、轻量级推理框架,同时拥有跨平台、高性能、模型压缩、代码裁剪等众多突出优势。TNN 框架在原有 Rapidnet、ncnn 框架的基础上进一步加强了移动端设备的支持以及性能优化,同时也借鉴了业界主流开源框架高性能和良好拓展性的优点。目前 TNN 已经在手 Q、微视、P 图等应用中落地,欢迎大家参与协同共建,促进 TNN 推理框架进一步完善。API调用主要对模型解析,网络构建,输入设定,输出获取四个步骤进行简要介绍,详细说明参见API详解部分。原创 2023-03-03 08:00:00 · 583 阅读 · 0 评论 -
图像分割网络FCN详解与代码实现
卷积神经网络从图像分类到到对象检测、实例分割、到图像语义分割、是卷积特征提取从粗糙输出到精炼输出的不断升级,基于卷积神经网络的全卷积分割网络FCN是像素级别的图像语义分割网络,相比以前传统的图像分割方法,基于卷积神经网络的分割更加的精准,适应性更强。FCN网络论文作者经过对比觉得最后一种方法计算更加精准,可以通过卷积学习插值系数,是一种更好的上采样方法,所以FCN最终采样是反向卷积实现上采样,完成像素级别预测。-反向卷积(转置卷积),学习,在这个过程中,filters大小是可以设置的。原创 2023-02-24 09:23:50 · 1127 阅读 · 0 评论 -
TensorFlow2和keras详细安装教程
Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。Keras 的开发重点是支持快速的实验。*能够以最小的时延把你的想法转换为实验结果,是做好研究的关键。Keras 优先考虑开发人员的经验Keras 被工业界和学术界广泛采用Keras 可以轻松将模型转化为产品Keras 支持多个后端引擎,不会将你锁定到一个生态系统中Keras 的发展得到深度学习生态系统中的关键公司的支持。...原创 2022-06-05 01:00:11 · 5347 阅读 · 0 评论