自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 论文解读-EMNLP 24-Safely Learning with Private Data

私有数据比公共数据更大、质量更高,能够有效提升大型语言模型 (LLM)的性能。然而,出于隐私考虑,这些数据通常分散在多个孤岛中,这使得其在 LLM 培训中的安全利用成为一个挑战。联邦学习 (FL) 是使用分布式私有数据训练模型的理想解决方案,但 FedAvg 等传统框架由于对客户端的计算要求很高。另一种选择是分割学习,将大部分训练参数保留在服务器,在本地仅训练嵌入层和输出层,降低了客户端的算力要求。尽管如此,它在安全性和效率方面仍面临重大挑战。

2024-12-20 10:00:00 614

原创 Python的继承

继承时父类有参数且子类需要新增参数

2024-03-06 21:46:13 223 1

原创 pytorch框架中的梯度反向传播

pytorch框架下的loss.backward()是机器学习代码中的重要部分,在最近的一个项目中需要提出模型中间量梯度进行处理,发现开源代码及网上的一些说法存在错误,并且".backward()"方法中有一些基础知识令人混淆,专门写了一个简单的模型测试了torch中的梯度反向传播过程。

2024-03-01 14:22:30 427 1

原创 CNN/Dailymail 数据集的三种处理方式

一份给NLP新手的cnn_dailymail数据集使用方式介绍,适用于huggingface的其他数据集

2023-08-25 20:35:07 2987 2

原创 数据不能排序时的变长序列处理

不排序的变长序列处理

2023-04-25 10:05:20 258 2

原创 神经网络(LSTM)中的变长序列处理及多GPU训练

个人写lstm为核心的算法时遇到的一些小问题的总结,主要是变长序列的处理,多GPU训练的使用,以及在使用多GPU训练时同时处理变长序列时遇到数据不能正常传入模型等问题。

2022-08-30 00:21:40 2633

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除