![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 89
Tian-Feng
人生几十年总会有风雨来陪,潇潇洒洒赴会今不醉不归!
展开
-
mask-R-CNN
代码论文# Mask-rcnn 算法在 torch vision 中有直接实现,可以直接引用使用在自己的工作中。Mask R-CNN(Mask Region-based Convolutional Neural Network)是一种用于目标检测和实例分割的深度学习模型,它是 Faster R-CNN 的扩展,同时可以生成目标的二进制掩码(mask),因此可以实现精确的实例分割。\1. 骨干网络:Mask R-CNN通常使用骨干网络(如 ResNet)来提取图像特征。这些特征用于目标检测和分割任务。原创 2023-10-16 17:42:52 · 177 阅读 · 0 评论 -
【Unet系列】
分割任务就是在原始图像中逐像素的找到你需要的家伙!原创 2023-10-05 15:47:57 · 221 阅读 · 0 评论 -
【DETR】
论文代码DETR(Data-efficient Image Transformer)是一种用于目标检测任务的深度学习模型。它与传统的目标检测方法不同,采用了Transformer架构,将目标检测问题转化为一个序列到序列的问题。以下是DETR模型的一些关键特点:Transformer架构: DETR采用了Transformer架构,这是一种用于自然语言处理的架构,但在DETR中被用于图像处理。这种架构允许模型同时处理整个图像,而不是传统的滑动窗口或区域提议方法。原创 2023-09-26 15:43:59 · 363 阅读 · 1 评论 -
EfficientNet笔记
论文EfficientNet 是一系列卷积神经网络架构,它旨在在计算资源受限的情况下实现更好的性能。EfficientNet 的设计思想是在网络的深度、宽度和分辨率方面进行均衡的调整,以获得高效且高性能的模型。复合系数(Compound Scaling):EfficientNet 使用了复合系数来平衡网络的深度、宽度和分辨率。它通过对网络的不同维度(例如深度、宽度、分辨率)应用统一的缩放因子来确保网络各个部分之间的平衡。这种方法使得网络可以在不同的任务和计算资源条件下进行调整。原创 2023-09-24 22:45:26 · 391 阅读 · 0 评论 -
【VAE】
毫无疑问的,当Encoder输出的数据分布越接近正态分布时,我们所构筑的正态分布才会越靠近原始数据中的信息,从这样的正态分布中抽取的样本才会更接近真实的数据样本。之前我们强调过,在变分自动编码器的流程当中,均值和标准差都不是通过他们的数学定义计算出来的,而是通过Encoder提炼出来的。现在就是我们要从p(Z|Xk)中采样一个Zk出来,尽管我们知道了p(Z|Xk)是正态分布,但是均值方差都是靠模型算出来的,我们要靠这个过程反过来优化均值方差的模型,但是“采样”这个操作是不可导的,而采样的结果是可导的。原创 2023-09-11 19:14:40 · 153 阅读 · 0 评论 -
【CLIP详读】
OpenAI的CLIP项目自从推出以来,CLIP引起了广泛的关注。它的方法看似简单,但效果非常出色,许多结果令人惊叹。例如,预训练模型可以在任何视觉分类数据集上实现出色的效果,而且最重要的是,它具有零样本学习的能力,这意味着它无需在这些数据集上进行额外的训练,就能够表现出色。作者进行了大量实验,涵盖了30多个数据集,包括OCR、视频动作检测、坐标定位和许多细粒度分类任务。原创 2023-09-02 19:48:52 · 568 阅读 · 0 评论 -
【BATCHNORMALIZATION、LAYERNORMALIZATION、INSTANCENORMALIZATION和GROUPNORMALIZATION】
加上第 N 个样本第1个通道,求平均,得到通道 1 的均值(注意是除以 N×H×W 而不是单纯除以 N,最后得到的是一个代表这个 batch 第1个通道平均值的数字,而不是一个 H×W 的矩阵)。求通道 1 的方差也是同理。作者发现,在生成模型中, feature map 的各个 channel 的均值和方差会影响到最终生成图像的风格,因此可以先把图像在 channel 层面归一化,然后再用目标风格图片对应 channel 的均值和标准差“去归一化”,以期获得目标图片的风格。原创 2023-06-12 15:30:59 · 179 阅读 · 0 评论 -
【stable diffusion原理解读通俗易懂,史诗级万字爆肝长文,喂到你嘴里】
stable diffusion作为Stability-AI开源图像生成模型,其出现也是不逊于ChatGPT,其发展势头丝毫不差于midjourney,加上其众多插件的加持,其上线也是无线拔高,当然,手法上也稍微比midjourney复杂点。论文源码至于为什么开源,**创始人:我这么做的原因是,我认为这是共同叙事(shared narrative)的一部分,有人需要公开展示发生了什么。再次强调,这应该默认就是开源的。原创 2023-06-04 16:23:14 · 4544 阅读 · 2 评论 -
realESR-GAN(超分辨率重建)
CSRGAN(Compressed Sensing with Regularization Generative Adversarial Network)是一种基于生成对抗网络(GAN)和压缩感知(CS)的图像超分辨率(SR)算法。它通过学习图像的稀疏表示来实现超分辨率重建,并使用生成对抗网络来提高重建图像的视觉质量。相较于其他传统的图像超分辨率算法,CSRGAN 在保持图像细节和纹理的同时,还能够有效地减少重建图像中的伪影和噪声。原创 2023-05-14 19:01:53 · 1192 阅读 · 1 评论 -
【Colab配置与使用】
还有一个问题colab使用为12个小时一天,如果执行超半个小时没动计算机colab会自动断开,如果我们程序还没执行完就很烦,如何解决?执行了代码后,记下弹出的数字,那是intervalId,当想停止这段代码的执行时,只需要执行。运行后Google会询问你是否运行云盘访问,点确定运行就行(左边drive文件挂载成功)连接到托管中运行(使用colab云实例)修改gpu运行还是GPU运行后保存。原创 2023-03-30 14:56:53 · 1239 阅读 · 0 评论 -
【最全python环境安装从anaconda到vscode到pytorch一条龙安装,完美解决你的安装烦恼】
第一次写完整安装,可以说把一些关键点都说出来了,你去搜索不一定有这么全,有些内容写得过于前面,但是为你后面安装pytorch做铺垫,如果你暂时不用pytorch,前面的内容够你用了,安装卸载管理基本一步到位了。 第一次完整安装,可以说把一些关键点都说出来了,你去搜索不一定有这么全,有些内容写得过于前面,但是为你后面安装pytorch做铺垫,如果你暂时不用pytorch,前面的内容够你用了,安装卸载管理基本一步到位了。两种对比,网页版更舒服看起来,而且这种格式本来就是网页版,下面提供安装方式。原创 2022-11-22 20:30:58 · 1495 阅读 · 0 评论 -
【反向传播算法搞不懂?看了几篇讲解还迷迷糊糊!我直接给你安排的明明白白!!!!】
至此,算完了一轮更新的权重(w1 - w8),将他们重新带入神经网络,输出将会和原始输出差距减小,经过不停地迭代,最终误差函数会越来越小。原创 2022-11-04 10:01:02 · 420 阅读 · 0 评论