pytorch自然语言处理之Pooling层的句子分类

最新推荐文章于 2024-05-29 08:49:38 发布

zenRRan

最新推荐文章于 2024-05-29 08:49:38 发布

阅读量2.1k

点赞数

分类专栏： nlp 深度学习文章标签：自然语言处理 nlp 机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27590277/article/details/88254545

版权

深度学习同时被 2 个专栏收录

28 篇文章 11 订阅

订阅专栏

26 篇文章 11 订阅

订阅专栏

Pooling作为最简单的层其实也可以作为句子分类任务。Pooling有很多种，max_Pooling,avg_Pooling,min_Pooling等。常用的还是max_Pooling:取同维度的最大值。

先看看流程图：

这里的Linear Layer后面应该经过一个Softmax的，可是由于交叉熵cross_entropy里隐含有Softmax，这里我就没有画了。

第一步搭建网络

这里除了划线的和类的名字外，其他都是pytorch固定模板。__init__就是搭建网络的函数，forward是数据怎么在你刚搭建的网络中流动的写出来就行，注意数据矩阵的维数，要前后对上。该维度可以用view()，t(),transport()按照想法进行改变。我在这个维度上浪费了很长时间，就是对不上。慢慢理解了，就会了。

这里的Embeding层就是把现实客观特征转成电脑识别的特征，也就是特征向量化。

第二步读入数据并将数据数字化

数据是这个样子：

前面文本后面类别

读取文本的类

清洗英文文本的函数，这个写过一次后，下次清洗文本直接复制直接用。

文本读取完后，建立词典，为只有数字序列化做准备。函数如下：

字典为：

然后通过函数调用就能生成数字序列：

第三步开始训练

因为用SGD很多时候不能够收敛。。。特别悲催。所以推荐用Adam优化。

这是计算精确度的函数，在一遍跑好的模型上走一遍Dev数据，得出开发集准确率。torch和numpy交换就用 .numpy()。

最后得出结果：

这个贼耗时间

精确度慢慢增长。。。

在此，非常感谢刘宗林师兄的技术支持。

源码：https://github.com/zenRRan/Stance-Detection

更多精彩内容，请关注 深度学习自然语言处理 公众号，就是下方啦！跟随小博主，每天进步一丢丢！哈哈！

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
pytorch自然语言处理之Pooling层的句子分类

Pooling作为最简单的层其实也可以作为句子分类任务。Pooling有很多种，max_Pooling,avg_Pooling,min_Pooling等。常用的还是max_Pooling:取同维度的最大值。先看看流程图：这里的Linear Layer后面应该经过一个Softmax的，可是由于交叉熵cross_entropy里隐含有Softmax，这里我就没有画了。第一步搭建网络...
复制链接

扫一扫

专栏目录

zenRRan CSDN认证博客专家 CSDN认证企业博客

码龄9年

327: 原创

2万+: 周排名

1010: 总排名

320万+: 访问

: 等级

1万+: 积分

2674: 粉丝

3546: 获赞

551: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

nlp 26篇
深度学习 28篇
其他 2篇
机器学习 27篇
linux 3篇
python 8篇
数学 3篇

最新评论

AI Agent框架——MetaGPT技术详解
lxylx910208: LLM
图解大模型推理优化之KV Cache
皮皮熊计算机: 是不是有一些公式没有正确显示，还是一些特殊符号没有正确显示？
Deita: 有限高质量数据在LLM的潜力是真的大
Geeksongs: 完全没翻译、准确，很多字符都被忽略掉了
Deepseek-V2技术报告解读！全网最细！
christin7: ”在经过embedding层后，与Deepseek-MoE保持一致，首先会经过一个共享的大Decoder层进行第一层计算，这层模型的attention计算设定与后续59层基本一致，唯一区别是这一层的mlp层固定为8个专家的宽度，没有门控额外参数激活的设定，这一设置与每层共享专家的设定一样，研究者希望语言生成的公共知识（包含流畅性、逻辑性等）被存储在这里。“ 作者这个判断有何而来，如何看出第一层是八个共享专家？这是不是与deepseek-MoE的模型结构不同了？
1-2B参数规模大模型使用心得及模型汇总
A56437994: 作者请教下你有做过定制化的小模型吗？效果如何。在我看来目前来说大模型还有一段路要走，后面细化之后，应该就可以用小模型实现通用了。这么说是因为之前有文章说大模型各隐藏层分布的参数比重及其不对等，有的很高很高，有的很少。未来应该会把隐藏层显化，了解各隐藏层的机制，然后进行优化

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。