深度学习
文章平均质量分 67
论文需要,记录学习!
快乐点吧
个人知识记录本
展开
-
【深度学习基础】模型文件介绍
本文档详细介绍了深度学习训练过程中生成的关键文件,及其在模型加载和推理中的作用。这些文件包括模型配置文件、模型权重文件、特殊标记映射文件、分词器配置文件和词汇表文件。用途: 包含模型的配置信息,包括模型结构和训练参数。内容示例:{解析: 这些参数定义了模型的架构。例如,表示每一层的隐藏单元数,表示多头注意力机制的头数。原创 2024-06-03 20:44:03 · 1379 阅读 · 0 评论 -
【深度学习基础】数据集&评估指标
在机器学习和自然语言处理(NLP)领域中,数据通常被分成三个文件:train.tsv、dev.tsv和test.tsv,并放在一个名为data的目录下。训练过程中,模型会在dev数据集上进行验证,以评估其在未见过的数据上的表现,并用于调整超参数和防止过拟合。在模型训练和调优完成后,使用test数据集来评估模型的泛化能力,确保模型在实际应用中具有良好的表现。精确率(Precision):分类器预测为正类的样本中实际为正类的比例。召回率(Recall):实际为正类的样本中被正确分类的比例。原创 2024-05-27 18:16:02 · 237 阅读 · 0 评论 -
【深度学习】反向梯度学习
里面部分图片内容出自chatgpt,总结的很好就用了。前置内容前向传播和损失函数和学习率。原创 2024-05-15 20:50:41 · 399 阅读 · 0 评论 -
【深度学习】参数初始化
学习流程跟着是b站up的5分钟学习深度学习反向传播是一种有效计算梯度(即损失函数相对于每个权重的偏导数)的方法,特别适用于具有多层结构的神经网络。它利用链式法则,从输出层开始,逐层向前计算,直到输入层,以此来确定每一层权重应该如何调整,以便减小预测输出与实际输出之间的差异(损失)。简而言之,反向传播,告诉我们在参数空间中应该朝哪个方向移动以减少损失。随机梯度下降是利用这些梯度信息进行权重更新的一种策略。原创 2024-05-16 18:37:54 · 463 阅读 · 0 评论 -
【深度学习】句子分类步骤
定义基于BERT的分类模型。Transformers库允许我们轻松地在预训练的BERT模型上添加一个分类头。新添加的分类头是一个全连接层(Dense Layer),其输入维度等于BERT模型的输出维度(对于BERT-base通常是768维),输出维度则等于你任务中的类别数量。例如,如果你正在进行二分类任务,输出维度就是2;如果是多分类任务,输出维度则与类别数量相匹配。# 加载预训练的BERT模型并添加分类头。原创 2024-05-23 20:50:34 · 357 阅读 · 1 评论