自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 NLP-Beginner 任务三:基于注意力机制的文本匹配

本次的实现方法是按照中所提出的增强型顺序推理模型进行。(下图左半部分)

2024-09-24 20:27:13 288

原创 使用ChatGLM-6B进行P-Tuning微调实战

使用ChatGLM-6B进行P-Tuning微调

2024-09-21 11:47:55 807

原创 NLP-Beginner 任务二:基于深度学习的文本分类

使用卷积神经网络(CNN)与随机初始化实现文本分类

2024-09-19 21:40:35 502

原创 NLP-Beginner 任务一:基于机器学习的文本分类

基于机器学习的文本分类

2024-09-17 19:14:48 486

原创 使用Cpolar内网穿透工具将部署在本地的大模型发布到公网

使用Cpolar内网穿透工具将部署在本地的大模型发布到公网

2024-09-12 19:02:12 184

原创 大模型LoRa微调训练曲线图分析:train_acc出现剧烈抖动

如图,在训练集上,train_acc出现剧烈抖动,原因是训练的batch_size太小。我这里的batch_size为1,如果调高一些,acc曲线图震荡的情况将会得到改善。

2024-09-06 20:37:13 150

原创 神经网络训练曲线分析:loss与val_loss 先上升后下降

其原因是:带momentum的方法训练,可看作在参数值和momentum组成的二元组上,每步乘一个矩阵,然后加一个噪音。不发散,要求这个矩阵的特征值范数小于1.但是,可能有复特征值和复特征向量。所以,虽然系数在衰减,但复的部分可能被变换到实的部分来,就出现初期loss上升的情况,直到模最大的系数被衰减到1以下。综上,初期loss上升,不一定发散,是正常的。在不带momentum的情况下,一般不应该出现这种情况。如图,对于val_loss和train_loss在训练初期出现上升,而后逐渐下降的情况是。

2024-09-06 20:30:44 198 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除