2021SC@SDUSC-山东大学软件工程与实践-Senta(5)

最新推荐文章于 2024-08-10 10:46:00 发布

Caster0920

最新推荐文章于 2024-08-10 10:46:00 发布

阅读量230

点赞数

文章标签： python

本文链接：https://blog.csdn.net/Casterrrrrrrr/article/details/121798263

版权

本文详细探讨了Senta中ELMO模型的使用，重点关注了paddlepaddle框架下的dropout机制，包括两种不同的实现方式，并解析了lstmp_encoder的输出组成。下篇将继续深入分析。

摘要由CSDN通过智能技术生成

本篇对Senta中token embedding中所使用的ELMO模型进行分析。

在这里插入图片描述

paddlepaddle：百度深度学习的框架 paddle.fluid.layers.dropout:
丢弃或者保持x的每个元素独立。Dropout是一种正则化手段，通过在训练过程中阻止神经元节点间的相关性来减少过拟合。根据给定的丢弃概率，dropout操作符按丢弃概率随机将一些神经元输出设置为0，其他的仍保持不变。

# -*- coding: utf-8 -*

"""ELMo model."""

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import paddle.fluid.layers as layers
import paddle.fluid as fluid
import numpy as np
import os

cell_clip = 3.0
proj_clip = 3.0
hidden_size = 4096
vocab_size = 52445
emb_size = 512


def dropout

最低0.47元/天解锁文章

Caster0920

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
2021SC@SDUSC-山东大学软件工程与实践-Senta(5)

本篇对Senta中token embedding中所使用的ELMO模型进行分析。paddlepaddle：百度深度学习的框架 paddle.fluid.layers.dropout:丢弃或者保持x的每个元素独立。Dropout是一种正则化手段，通过在训练过程中阻止神经元节点间的相关性来减少过拟合。根据给定的丢弃概率，dropout操作符按丢弃概率随机将一些神经元输出设置为0，其他的仍保持不变。# -*- coding: utf-8 -*"""ELMo model."""from __f
复制链接

扫一扫