神经网络基础知识

春不寒.

已于 2023-02-12 21:20:06 修改

阅读量1.1k

点赞数 1

分类专栏：神经网络文章标签：神经网络深度学习

于 2023-02-12 21:18:18 首次发布

本文链接：https://blog.csdn.net/Mr_Happy_/article/details/128999831

版权

神经网络专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文介绍了神经网络的基础知识，包括激活函数如sigmoid、Tanh和LeakyReLU，以及过拟合和欠拟合的概念。讨论了不同类型的梯度下降法在优化过程中的应用，如SGD、BGD和MBGD。卷积神经网络的要点如感受野、下采样和Flattening也被提及。此外，还涵盖了循环神经网络(RNN)、LSTM和Attention机制在处理序列数据时的重要性。

摘要由CSDN通过智能技术生成

神经网络基础知识

一、人工神经网络

1.激活函数

sigmod函数

在这里插入图片描述

Tanh函数

在这里插入图片描述

Leaky Relu函数

在这里插入图片描述

分析

sigmod和Tanh函数为饱和函数，leaky Relu函数为非饱和函数，使用非饱和激活函数的优势在于：

非饱和函数能解决深度神经网络(层数非常多)的梯度消失问题，浅层网络才能使用sigmod作为激活函数。
非饱和函数能够加快收敛速度。

激活函数的作用是将ANN模型中一个节点的输入信号转换成一个输出信号，若不运用激活函数的话，则输出信号将仅仅是一个简单的线性函数。

2.过拟合和欠拟合

欠拟合是指模型在训练集、验证集和测试集上均表现不佳的情况；
过拟合是指模型在训练集上表现很好，到了验证和测试阶段就很差，即模型的泛化能力很差。

二、学习与感知机

1.损失函数与代价函数

代价(目标)函数是损失函数的平均值
输入x通过模型预测输出y，此过程称为向前传播，而将预测与真实值的差值减小需要更新模型中的参数，这个过程称为向后传播。

损失函数

在这里插入图片描述

代价函数C(x)，若是有多个样本可以将所有代价函数的取值求均值，记作J(x)。优化参数x，最常用的方法就是梯度下降，就是对代价函数J(x)的偏导数。

代价函数

在这里插入图片描述

均方误差通常用在线性回归问题中，交叉熵代价函数通常用在分类问题中。
损失函数（Loss Function ）是定义在单个样本上的，算的是一个样本的误差。

代价函数（Cost Function ）是定义在整个训练集上的，是所有样本误差的平均，也就是损失函数的平均。

目标函数（Object Function）定义为：最终需要优化的函数。等于经验风险+结构风险（也就是Cost Function + 正则化项）。

2. 线性回归和逻辑回归

线性回归是回归问题(预测数值是连续型的)，逻辑回归是分类问题(预测数值是离散型的)
逻辑回归就是将线性回归的值映射到sigmod函数当中，两者的求解步骤是类似的。

3. 监督学习与无监督学习

监督学习的学习方法是分类和回归，常用的算法是K-近邻算法、决策树、朴素贝叶斯、逻辑回归。
无监督学习的学习方法是：

聚类：K-均值聚类、BIRCH聚类、高斯混合聚类
降维：主成分分析(PCA)(通过线性变换将原始数据变换为一组各维度线性无关的表示，可以用于提取数据的主要特征分量。)

监督学习是根据已有数据集，知道输入和输出结果之间的关系，然后根据这种已知关系训练得到一个最优模型。训练数据应该既有特征(x)又有标签(y)，然后通过训练，找到特征和标签之间的联系。
监督学习中的数据是带有一系列标签的，在无监督学习中，需要用某种算法去训练无标签的训练集从而能够让我们找到这组数据的潜在结构。
监督式学习中的分类和回归：回归指利用训练数据预测输出值，例如利用回归从训练数据中预测股票价格。分类指将输出分组到某一类。例如使用分类预测数据样本的年龄。
监督学习中的支持向量机(SVM)