keras attention机制

最新推荐文章于 2024-06-07 09:49:46 发布

深度学习扛把子

最新推荐文章于 2024-06-07 09:49:46 发布

阅读量1k

点赞数

分类专栏：机器学习 Keras

本文链接：https://blog.csdn.net/qq_16792139/article/details/116981727

版权

机器学习同时被 2 个专栏收录

22 篇文章 3 订阅

订阅专栏

Keras

11 篇文章 0 订阅

订阅专栏

class Attention(tf.keras.layers.Layer):
    """
    Multi-Head Convolutional Self Attention Layer
    """

    def __init__(self, dk, dv, num_heads, filter_size):
        super().__init__()
        self.dk = dk
        self.dv = dv
        self.num_heads = num_heads

        self.conv_q = tf.keras.layers.Conv1D(dk * num_heads, filter_size, padding='causal')
        self.conv_k = tf.keras.layers.Conv1D(dk * num_heads, filter_size, padding='causal')
        self.dense_v = tf.keras.layers.Dense(dv * num_heads)
        self.dense1 = tf.keras.layers.Dense(dv, activation='relu')
        self.dense2 = tf.keras.layers.Dense(dv)

    def split_heads(self, x, batch_size, dim):
        x = tf.reshape(x, (batch_size, -1, self.num_heads, dim))
        return tf.transpose(x, perm=[0, 2, 1, 3])

    def call(self, inputs):
        batch_size, time_steps, _ = tf.shape(inputs)
        q = self.conv_q(inputs)
        k = self.conv_k(inputs)
        v = self.dense_v(inputs)
        q = self.split_heads(q, batch_size, self.dk)
        k = self.split_heads(k, batch_size, self.dk)
        v = self.split_heads(v, batch_size, self.dv)
        mask = 1 - tf.linalg.band_part(tf.ones((batch_size, self.num_heads, time_steps, time_steps)), -1, 0)
        dk = tf.cast(self.dk, tf.float32)
        score = tf.nn.softmax(tf.matmul(q, k, transpose_b=True) / tf.math.sqrt(dk) + mask * -1e9)
        outputs = tf.matmul(score, v)
        outputs = tf.transpose(outputs, perm=[0, 2, 1, 3])
        outputs = tf.reshape(outputs, (batch_size, time_steps, -1))
        outputs = self.dense1(outputs)
        outputs = self.dense2(outputs)
        return outputs

深度学习扛把子

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
keras attention机制

class Attention(tf.keras.layers.Layer): """ Multi-Head Convolutional Self Attention Layer """ def __init__(self, dk, dv, num_heads, filter_size): super().__init__() self.dk = dk self.dv = dv self.num_heads .
复制链接

扫一扫

专栏目录