自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

m0_48194799的博客

原创论文解读-EMNLP 24-Safely Learning with Private Data

私有数据比公共数据更大、质量更高，能够有效提升大型语言模型（LLM）的性能。然而，出于隐私考虑，这些数据通常分散在多个孤岛中，这使得其在 LLM 培训中的安全利用成为一个挑战。联邦学习（FL）是使用分布式私有数据训练模型的理想解决方案，但 FedAvg 等传统框架由于对客户端的计算要求很高。另一种选择是分割学习，将大部分训练参数保留在服务器，在本地仅训练嵌入层和输出层，降低了客户端的算力要求。尽管如此，它在安全性和效率方面仍面临重大挑战。

2024-12-20 10:00:00 614

原创 Python的继承

继承时父类有参数且子类需要新增参数

2024-03-06 21:46:13 223 1

原创 pytorch框架中的梯度反向传播

pytorch框架下的loss.backward()是机器学习代码中的重要部分，在最近的一个项目中需要提出模型中间量梯度进行处理，发现开源代码及网上的一些说法存在错误，并且".backward()"方法中有一些基础知识令人混淆，专门写了一个简单的模型测试了torch中的梯度反向传播过程。

2024-03-01 14:22:30 427 1

原创 CNN/Dailymail 数据集的三种处理方式

一份给NLP新手的cnn_dailymail数据集使用方式介绍,适用于huggingface的其他数据集

2023-08-25 20:35:07 2987 2

原创数据不能排序时的变长序列处理

不排序的变长序列处理

2023-04-25 10:05:20 258 2

原创神经网络（LSTM）中的变长序列处理及多GPU训练

个人写lstm为核心的算法时遇到的一些小问题的总结，主要是变长序列的处理，多GPU训练的使用，以及在使用多GPU训练时同时处理变长序列时遇到数据不能正常传入模型等问题。

2022-08-30 00:21:40 2633

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄5年

6
原创

30
点赞

41
收藏

18
粉丝

关注

私信

热门文章

最新评论

数据不能排序时的变长序列处理
小白good job.: 那么请问total_length要如何设置呢
Python的继承
CSDN-Ada助手: 恭喜用户写了关于Python的继承的博客！持续创作是提升自己的不二法门，希望你能继续分享更多有趣的知识和经验。建议下一篇博客可以深入探讨Python中的多态性，相信会给读者带来新的启发和收获。期待你的下一篇作品！
pytorch框架中的梯度反向传播
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
CNN/Dailymail 数据集的三种处理方式
qq_43552871: datasets.utils.info_utils.ExpectedMoreDownloadedFiles: {'https://huggingface.co/datasets/cnn_dailymail/resolve/11343c3752184397d56efc19a8a7cceb68089318/data/dailymail_stories.tgz', 'https://huggingface.co/datasets/cnn_dailymail/resolve/11343c3752184397d56efc19a8a7cceb68089318/data/cnn_stories.tgz', 'https://raw.githubusercontent.com/abisee/cnn-dailymail/master/url_lists/all_test.txt', 'https://raw.githubusercontent.com/abisee/cnn-dailymail/master/url_lists/all_val.txt', 'https://raw.githubusercontent.com/abisee/cnn-dailymail/master/url_lists/all_train.txt'} 这是怎么回事
CNN/Dailymail 数据集的三种处理方式
CSDN-Ada助手: 恭喜您撰写了关于"CNN/Dailymail 数据集的三种处理方式"的博客！持续创作是一件了不起的事情，尤其是在这个领域中。通过您的文章，我对CNN/Dailymail数据集的处理方式有了更深入的了解。接下来，我建议您可以探索更多关于该数据集的方面，例如不同领域的应用、数据集的局限性以及可能的改进方法等。这些内容将进一步丰富您的博客，并为读者提供更全面的信息。再次祝贺您的努力和成果！期待您未来更多精彩的创作！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

提示

确定要删除当前文章？

取消删除