神经网络与深度学习课程笔记（四）

最新推荐文章于 2024-07-25 19:00:00 发布

lhdskla

最新推荐文章于 2024-07-25 19:00:00 发布

阅读量40

点赞数

文章标签：深度学习神经网络笔记

本文链接：https://blog.csdn.net/lhdskla/article/details/130156353

版权

数据集输出表达：

目标检测基本思想：

YOLO官方的模型结构图：

语义分割关注如何将图像分割成属于不同语义类别的区域。值得一提的是，这些语义区域的标注和预测都是像素级的。与目标检测相比，语义分割标注的像素级的边框更加精细。

计算机视觉领域还有2个与语义分割相似的重要问题，即图像分割和实例分割：

图像分割将图像分割成若干组成区域。这类问题的方法通常利用图像中像素之间的相关性。它在训练时不需要有关图像像素的标签信息，在预测时也无法保证分割出的区域具有我们希望得到的语义。
实例分割又叫同时检测并分割。它研究如何识别图像中各个目标实例的像素级区域。与语义分割有所不同。

使用卷积神经网络自动将某图像中的样式应用在另一图像之上，即风格迁移。这里我们需要两张输入图像，一张是内容图像，另一张是样式图像，我们将使用神经网络修改内容图像使其在样式上接近样式图像。

方法：

首先，我们初始化合成图像，例如将其初始化成内容图像。该合成图像是样式迁移过程中唯一需要更新的变量，即样式迁移所需迭代的模型参数。
然后，我们选择一个预训练的卷积神经网络来抽取图像的特征，其中的模型参数在训练中无须更新。深度卷积神经网络凭借多个层逐级抽取图像的特征。我们可以选择其中某些层的输出作为内容特征或样式特征。

在这里插入图片描述

在这里插入图片描述

特征编码

将数据中的各种属性和特征转换成可供机器学习算法或其他统计分析方法处理的数值或向量形式。常用的编码方式有One-Hot编码，Label Encoding等。
文本处理

将文本数据转换成机器可以理解的形式，主要包括文本清洗、分词、停用词处理、词向量化等技术。文本处理技术可以使文本数据适合于机器学习算法的输入。常用的文本处理方法有词袋模型、TF-IDF等。

一篇文章可以被简单地看作一串单词序列，甚至是一串字符序列。我们将解析文本的常见预处理步骤。这些步骤通常包括：

关注