论文阅读：N3LDG，一种轻量级自然语言处理深度学习库

最新推荐文章于 2024-07-10 21:33:17 发布

咕噜咕噜day

最新推荐文章于 2024-07-10 21:33:17 发布

阅读量390

点赞数

分类专栏： nlg_paper 文章标签： NLP Pytorch N3LDG

本文链接：https://blog.csdn.net/qq_36533552/article/details/89033047

版权

26 篇文章 3 订阅

订阅专栏

pytorch之前的库都是静态定义计算图的，pytorch和N3LDG都是是动态定义计算图，本库实现了动态计算图和自动批量化

自然语言处理构建适用所有实例的计算图难处：

1. 相关工作

GPU加速：高效的分配显存。比如创建3个显存块，一个前向传播使用，一个反向传播，最后一个用于存储参数和相关梯度。通过显存池动态分配。

2.计算图

2.1 计算图的引入

2.2自动批量化

3 CPU计算

4 GPU计算：并行能力

cuBLAS是英伟达的CUDA线性代数计算库，并需要编写核函数实现。但N3LDG是不依赖cuDNN
GPU两类操作存在性能瓶颈：
- 1.显存的分类和释放
- 2.显存和内存直接的IO
- 由于动态构建计算图时，各向量地址的动态变化
优化：
- 1.针对显存的分配和释放：由于实验过程中显存的分配和释放占用了总训练大量的时间。所以通过显存池进行管理，只有显存池不够时才去申请新模块
- 2.将需要传输到显存的同样大小数据，先在内存中连续存放，再调用一次库函数传至显存。

5 实验

2、在GPU上N3LDG对比了PyTorch CUDA 和 PyTorch cuDNN，N3LDG在CNN和Tree-LSTM上面性能更优，在Bi-LSTM上当MB较大时性能更优。（不使用 cuDNN 的PyTorch(称之为 PyTorch CUDA)以及使用 cuDNN的 PyTorch(PyTorch cuDNN)）