KERAS和tensroflow实现Attention机制

最新推荐文章于 2024-04-30 13:33:23 发布

NanciZhao

最新推荐文章于 2024-04-30 13:33:23 发布

阅读量1.2k

点赞数 2

分类专栏： tensorflow

本文链接：https://blog.csdn.net/yeziyezi1986/article/details/104632767

版权

本文详细介绍了如何使用Keras和TensorFlow实现Attention机制，包括Position_Embedding和Multi_Head_Attention两个关键组件的实现代码。通过这两部分，读者可以了解Attention在深度学习模型中的具体应用。

摘要由CSDN通过智能技术生成

一、Keras实现Attention

from keras import backend as K
from keras.engine.topology import Layer

class Position_Embedding_Attention(Layer):

def __init__(self, size=None, mode='sum', **kwargs):
self.size = size #必须为偶数
self.mode = mode
super(Position_Embedding, self).__init__(**kwargs)

def call(self, x):
if (self.size == None) or (self.mode == 'sum'):
self.size = int(x.shape[-1])
batch_size,seq_len = K.shape(x)[0],K.shape(x)[1]
position_j = 1. / K.pow(10000., 2 * K.arange(self.size / 2, dtype='float32') / self.size)
position_j = K.expand_dims(position_j, 0)
position_i = K.cumsum(K.ones_like(x[:,:,0]), 1)-1 #K.arange不支持变长，只好用这种方法生成
position_i = K.expand_dims(position_i, 2)
position_ij = K.dot(position_i, position_j)
position_ij = K.concatenate([K.cos(position_ij), K.sin(position_ij)], 2)
if self.mode == 'sum':
return position_ij + x
elif self.mode == 'concat':
return K.concatenate([position_ij, x], 2)

def compute_output_shape(self, input_shape):
if self.mode == 'sum':
return input_shape
elif self.mode == 'concat':
return (input_shape[0], input_shape[1], input_shape[2]+self.size)

class Multi_Head_AttentionAttention(Layer):

def __init__(self, nb_head, size_per_head, **kwargs):
self.nb_head = nb_head
self.size_per_head = size_per_head
self.output_dim = nb_head*size_per_head
super(Attention, se

最低0.47元/天解锁文章

NanciZhao

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
KERAS和tensroflow实现Attention机制

一、Keras实现Attentionfrom keras import backend as Kfrom keras.engine.topology import Layerclass Position_Embedding_Attention(Layer): def __init__(self, size=None, mode='sum', **kwargs): ...
复制链接

扫一扫