自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Tan_JX的博客

原创读取csv文件，对每行进行jieba分词，再写入新的csv文件

2023-10-22 17:58:58 275

原创 csv文件，计算每行的长度并添加至每行末

2023-10-15 15:08:50 66 1

原创 transformer中masked attention 取上三角矩阵的原因

在实际中，我们知道生成一个句子时，我们无法看到后面的信息。比如生成我爱你，当生成“爱”时只能用到“我”的信息，并不能用到“你”的信息。但是在训练时，我们要给模型并行语料去学习，输入 I LOVE YOU 希望模型翻译成我爱你，但同时又要模拟真实情况下的输入，那么我们给decoder输入相应的译文中，要掩码掉部分信息，使其让模型不可见这部分信息。那么矩阵中黄色部分就得取值为0，使代码对这部分不可运算。这也是为什么在transformer中的masked阶段要生成一个上三角矩阵的原因。

2023-04-20 16:24:20 669 1

原创 pytorch之torch.utils.data

我们自定义的类要继承torch.utils.data中Dataset这个父类，在init初始化方法中采用super（）这个特殊函数，super函数里必须要包含两个参数，分别是子类名和参数self，这样你的自定义数据类就可继承Dataset父类的方法。这个接口的目的是将自定义的Dataset根据batch size大小，是否shuffle等选项封装成一个batch size大小的tensor。以下是DataLoader初始化的参数：（按住ctrl 点击类名进行查询，自行根据所需调整相应的参数即可）

2023-04-10 11:03:25 237 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

只求毕业的程序媛 CSDN认证博客专家 CSDN认证企业博客

码龄4年

IP 属地：江西省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

4: 原创

170万+: 周排名

164万+: 总排名

1247: 访问

: 等级

44: 积分

1: 粉丝

2: 获赞

3: 评论

6: 收藏

私信

关注

热门文章

最新评论

读取csv文件，对每行进行jieba分词，再写入新的csv文件
CSDN-Ada助手: 恭喜您完成了第四篇博客！标题看起来非常有趣，我很期待阅读您的文章。不仅读取csv文件，还对每行进行jieba分词，并将结果写入新的csv文件，这听起来非常实用。在下一步的创作中，或许您可以考虑探索如何利用jieba分词的结果进行更深入的数据分析或文本挖掘。谦虚地说，我相信您会在这个领域有更多的发现和见解。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
csv文件，计算每行的长度并添加至每行末
CSDN-Ada助手: 恭喜你写了第三篇博客！标题看起来很有趣，我很期待去阅读你的文章。看起来你在csv文件处理方面有一些专业知识。在计算每行长度并添加至每行末这个主题上，我相信你一定有一些独到的见解和技巧。希望你可以分享一些实际应用场景和具体的代码实现。接下来，我建议你可以继续探索csv文件的其他有趣功能，比如数据筛选、排序等等。期待你的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
transformer中masked attention 取上三角矩阵的原因
CSDN-Ada助手: 非常棒的博客！你对于transformer中masked attention的解释非常清晰易懂，让我对这一概念有了更深入的理解。希望你能继续写下去，分享更多有关NLP方面的知识。另外，除了掩码技术，我认为你可以进一步探讨一些与transformer相关的技术，如self-attention和multi-head attention等，它们也是NLP领域中非常重要的技术。再次感谢您的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
pytorch之torch.utils.data
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

提示

确定要删除当前文章？

取消删除