深度学习
文章平均质量分 93
X.AI666
人工智能专业再读,INTJ,欢迎大家与我交流问题
展开
-
【深度学习】深入探索卷积神经网络:从基础到先进架构”
深度学习是机器学习的一个分支,它通过学习数据的多层次表示来实现复杂任务的自动化,其中“深度”指的是模型中层的数量。计算机视觉,作为人工智能的一个重要领域,旨在使计算机能够从图像或视频中“看”和“理解”世界。卷积神经网络的概念源于对生物视觉感知机制的研究。它们通过模仿生物神经网络的结构,特别是视觉皮层中的局部感知机制,以及层与层之间的连接方式,来实现对视觉数据的高效处理。原创 2024-04-13 08:00:00 · 1219 阅读 · 0 评论 -
【深度学习】多层感知机与卷积神经网络解析
在人工智能的宏伟画卷中,深度学习如同一笔瑰丽而深邃的色彩,为这幅画增添了无限的生命力和潜能。作为支撑这一领域核心技术的基石,多层感知机(MLP)和卷积神经网络(CNN)在模仿人类大脑处理信息的方式中扮演了重要角色,并在解决复杂计算机视觉问题上展现出了惊人的能力。本文将带领读者深入这两种网络结构的深层次机制,揭示其在当前科技革命中如何发挥着不可替代的作用。原创 2024-04-11 08:00:00 · 1396 阅读 · 0 评论 -
【深度学习】从基础原理到未来挑战的全面探索
深度学习,一种模拟人脑分析和处理数据的机器学习技术,已成为人工智能研究中最令人兴奋的进展之一。其核心在于构建和训练神经网络,这些网络由多个层次组成,每一层都能从输入数据中提取并转换特征。随着数据层层传递,更深层次的网络能学习到更加复杂的数据表示。原创 2024-04-07 08:00:00 · 722 阅读 · 0 评论 -
YOLO系列详解(YOLOV1-YOLOV3)
YOLO提出时由于one-stage特性,速度很快,FPS可以达到45,总体精度低于FastRCNN。遗憾的是,由于网格稀疏,对小对象预测效果较差。总的来说,为工业实时检测提供了新的思路。YOLO2在参考RCNN系列检测的前提下,自行设计了网络结果和训练优化手段,取得了不错的效果,为很多检测算法提供了新的思路。相比于YOLO2,YOLO3没有什么太突破的成果,参照ResNet加深了网络结构,使用比较流行的多尺度融合提升了小目标检测效果。原创 2024-02-11 12:00:00 · 3919 阅读 · 2 评论 -
【深度学习】实验7实验结果,图像超分辨
生成器的任务是从低分辨率的输入图像(例如,随机噪声)生成高分辨率的图像。生成器的损失包括生成的图像的均方误差损失和判别器的输出误差。判别器的损失包括正确分类真实图像和伪造图像的误差。判别器包括多个卷积层和下采样层,逐渐减小输入图像的分辨率。通过这些层,判别器学会识别图像的特征,以便能够准确分类真实和伪造图像。网络的前面的卷积层,用于提取图像的特征。这些特征用于衡量生成的图像在特征空间上与真实图像的相似性。判别器的任务是将输入的图像分类为真实图像(来自训练数据集)或伪造图像(由生成器生成)。原创 2024-02-09 15:43:59 · 1083 阅读 · 1 评论 -
【深度学习】实验7布置,图像超分辨
相关知识点:生成对抗网络、图像处理(PIL)和可视化(matplotlib。原创 2024-02-09 15:42:55 · 1485 阅读 · 1 评论 -
【深度学习】: 脑部MRI图像分割
本次案例将使用深度学习技术来完成脑部MRI(磁共振)图像分割任务,即对于处理好的一张MRI图像,通过神经网络分割出其中病变的区域。本次案例使用的数据集来自Kaggle[1],共包含110位病人的MRI数据,每位病人对应多张通道数为3的.tif格式图像,其对应的分割结果为单通道黑白图像(白色为病变区域)原创 2024-02-07 10:18:08 · 1846 阅读 · 3 评论 -
【深度学习】:实验6答案,图像自然语言描述生成(让计算机“看图说话”)(超详细版本)
本次案例将使用深度学习技术来完成图像自然语言描述生成任务,输入一张 图片,模型会给出关于图片内容的语言描述。本案例使用 coco2014 数据集 [1] ,包 含 82,783 张训练图片, 40,504 张验证图片, 40,775 张测试图片。案例使用 AndrejKarpathy[2] 提供的数据集划分方式和图片标注信息,案例已提供数据处理的脚本, 只需下载数据集和划分方式即可。 图像自然语言描述生成任务一般采用 Encoder-Decoder 的网络结构, Encoder 采用 CNN 结构原创 2024-02-09 10:00:00 · 1060 阅读 · 1 评论 -
【深度学习】:实验6布置,图像自然语言描述生成(让计算机“看图说话”)
间步解码时的输入单词为标签单词,而非上一步解码出来的预测单词。的是生成一组权重,对需要关注的部分给予较高的权重,对不需要关注的部分给。图像中该单词对应的特定区域,即该单词主要是由这片区域对应的特征生成的。输入除了上一步的隐藏状态和单元状态外,还有一个向量,该向量由单词经过。经过与输入相同步长的解码之后,计算预测和标签之间的交叉熵损失,进行。选择一张图片,可以是测试集中的,也可以是自行挑选的,对图片进行语言。提供的数据集划分方式和图片标注信息,案例已提供数据处理的脚本,同时还需要输入描述语言的长度,原创 2024-02-08 12:00:00 · 1255 阅读 · 0 评论 -
【深度学习】:滴滴出行-交通场景目标检测
相关知识点:目标检测、开源框架的配置和使用(mmdetection, mmcv)原创 2024-02-05 13:12:41 · 1403 阅读 · 3 评论 -
深度学习新进展:探析AI领域的最新发展
近年来,随着Transformer模型的出现,BERT、GPT-3等模型在语义分析、情感分析、机器翻译和问答系统等任务上不仅效果更好,而且速度更快。近年来,深度学习技术取得了惊人的发展,应用范围不断扩大,涵盖了社交网络、自动驾驶、医疗诊断、金融预测等众多领域。另外,生成对抗网络(GAN)的出现,则引领了计算机视觉领域新的发展方向,如图像合成、图像到图像翻译、视频生成等。深度学习源于人工神经网络,这些人工神经网络为神经元之间的连接和信息传递提供了计算模型,模拟了人类的结构,奠定了深度学习的基础。原创 2024-02-04 14:40:32 · 1272 阅读 · 0 评论 -
【深度学习】CIFAR10图像分类
使用PyTorch分别实现多层感知机(MLP)和卷积网络(ConvNet),并完成CIFAR10数据集(http://www.cs.toronto.edu/~kriz/cifar.html)分类。本案例不提供初始代码,请自行配置网络和选取超参数,包括层数、卷积核数目、激活函数类型、损失函数类型、优化器等方面。提交所有代码和一份案例报告,要求如下:l详细介绍所使用的模型及其结果,至少包括超参数选取,损失函数、准确率及其曲线;原创 2024-02-04 00:35:37 · 679 阅读 · 1 评论 -
【深度学习】: MNIST手写数字识别
MNIST手写数字识别数据集是图像分类领域最常用的数据集之一,它包含60,000张训练图片,10,000张测试图片,图片中的数字均被缩放到同一尺寸且置于图像中央,图片大小为28×28。MNIST数据集中的每个样本都是一个大小为784×1的矩阵(从28×28转换得到)。MNIST数据集中的数字包括0到9共10类,如下图所示。注意,任何关于测试集的信息都不该被引入训练过程。在本次案例中,我们将构建多层感知机来完成MNIST手写数字识别。原创 2024-02-03 23:07:46 · 2090 阅读 · 1 评论 -
【深度学习】:Softmax实现手写数字识别
本次案例中,你需要用python实现Softmax回归方法,用于MNIST手写数字数据集分类任务。你需要完成前向计算loss和参数更新。你需要首先实现Softmax函数和交叉熵损失函数的计算。在更新参数的过程中,你需要实现参数梯度的计算,并按照随机梯度下降法来更新参数。具体计算方法可自行推导。原创 2024-02-03 22:16:53 · 1719 阅读 · 1 评论