- 博客(4)
- 收藏
- 关注
原创 神经网络与深度学习(四)
一篇文章可以被简单地看作一串单词序列,甚至是一串字符序列。 我们将 解析文本的常见预处理步骤。 这些步骤通常包括: 1.将文本作为字符串加载到内存中。 2.将字符串切分为词元(如单词和字符)。 3.建立一个字典,将拆分的词元映射到数字索引。 4.将文本转换为数字索引序列,方便模型操作。文本的对齐:初始化模型参数:模型定义:训练和预测:
2024-05-20 20:55:03 286
原创 神经网络与深度学习学习笔记(二)
多层感知机在单层神经网络的基础上引入了一到多个隐藏层(hidden layer)。隐藏层位于输入层和输出层之间。图2展示了一个多层感知机的神经网络图,它含有一个隐藏层,该层中有5个隐藏单元。前向传播是指对神经网络沿着从输入层到输出层的顺序,依次计算并存储模型的中间变量(包括输出)。其中z为中间变量,W为隐藏层的权重函数。将中间变量赋值给激活函数,将可以得到向量长度为h的隐藏层。多层感知机中的隐藏层和输出层都是全连接层。如图1 所示,该问题无法进行线性分类。图2 带有隐藏层的多层感知机模型。
2024-04-23 16:30:16 156
原创 神经网络与深度学习学习笔记(一)
定义:利用数理统计中回归分析,来确定变量间相互依赖的定量关系要素:训练集(training set)一般称为x 输出数据(traning label)一般称为y 拟合的函数(称为假设或者模型)y=h(x) 线性回归模型总结: 引入超平面参数: 定义:线性分类器则透过特征的线性组合来做出分类决定,以达到此种目的。简言之,样本通过直线(或超平面)可分。
2024-04-01 11:02:10 638
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人