Keras/TensorFlow 中，call(self, inputs, training=None, **kwargs)的使用说明

风雨打工人

于 2025-03-25 14:45:09 发布

阅读量665

点赞数 10

CC 4.0 BY-SA版权

文章标签： tensorflow keras python

本文链接：https://blog.csdn.net/GHL_17768588743/article/details/146502933

在 Keras/TensorFlow 中，call(self, inputs, training=None, **kwargs) 是自定义层（Layer 子类）的核心方法，它定义了层的前向传播逻辑。以下是其工作原理的详细解析，分多个维度展开：

‌1. 核心作用‌

‌前向传播‌：将输入张量 inputs 转换为输出张量。
‌动态行为控制‌：通过 training 参数区分训练和推理模式（例如 Dropout、BatchNorm 层的行为差异）。
‌扩展功能‌：通过 **kwargs 支持额外的参数（如 mask 用于序列模型）。

‌2. 参数详解‌

‌(1) `inputs`‌

‌类型‌：单个张量（tf.Tensor）或张量列表/字典。
‌作用‌：接收前一层的输出作为输入。

‌示例‌：

def call(self, inputs):
    # 假设 inputs 是单个张量
    return tf.matmul(inputs, self.weights) + self.bias

‌(2) `training=None`‌

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

风雨打工人

关注关注

10
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

基于Transformer实现文本分类（Keras/TensorFlow）

白马负金羁

02-16

3212

2017年，Google 在论文 Attention is All you need 中提出了 Transformer 模型，其使用 Self-Attention 结构取代了在 NLP 任务中常用的 RNN 网络结构。而且实验也证明Transformer 在效果上已经完败传统的 RNN 网络

tensorflow2.0 的Layer 的 call build init方法

Buevara的博客

05-12

1554

官方API 显然，这三个函数都是从tf.keras.layers.Layer处继承而来的。 _init_ 可以在其中进行所有与输入无关的初始化 build 知道输入张量的形状，并可以进行其余的初始化 call 可以在其中进行前向计算官方API的例子： class MyDenseLayer(tf.keras.layers.Layer): def __init__(self, num_outputs): super(MyDenseLayer, self).__init__() sel

参与评论您还未登录，请先登录后发表或查看评论

tensorflow矩阵操作相关函数

u012580657的博客

03-14

966

（一）矩阵生成操作 def ones(shape, dtype=dtypes.float32, name=None)://创建一个形状为shape的矩阵元素值都为1，默认元素类型float32 def zeros(shape, dtype=dtypes.float32, name=None)://创建一个形状为shape的矩阵元素值都为0，默认元素类型float32 def ones_l...

深度学习代码

HandsomeWey的博客

04-20

217

研究生期间代码

度学习模型的输出形状中，None的含义？

weixin_44943389的博客

11-14

568

并不是错误，而是一个占位符，表示该维度的大小将在运行时根据输入数据的批次大小动态确定。如果在训练时使用了不同的批次大小，模型也能够适应这种变化。这是因为在定义模型时，通常不知道在训练过程中会使用多大的批次。在实际的训练和推理中，你会传递具体的批次大小给模型，而这个值会在模型的摘要中显示出来。这表示模型在输出时，对于每个输入样本，都会生成一个长度为7的向量。例如，如果你在使用模型进行推理或评估时传递了一个具体的批次大小，那么。就代表着批处理大小是不确定的，会根据实际使用的批次大小而变化。在模型的输出形状中，

NotImplementedError: Cannot convert a symbolic Tensor (lstm_1/strided_slice:0) to a numpy array. --------------------------------------------------------------------------- NotImplementedError Traceback (most recent call last) Cell In[20], line 51 48 start_time = time.time() 50 # 选择要训练的模型类型（rnn/lstm/gru） ---> 51 train_model(model_type='lstm') 53 # 计算总耗时 54 total_time = time.time() - start_time Cell In[20], line 13, in train_model(model_type) 11 model = build_gru_model() 12 else: # 默认使用LSTM ---> 13 model = build_lstm_model() 15 # 打印模型结构 16 model.summary() Cell In[16], line 2, in build_lstm_model() 1 def build_lstm_model(): ----> 2 model = keras.Sequential([ 3 layers.Embedding(total_words, embedding_len, input_length=max_review_len), 4 layers.LSTM(64, return_sequences=False), 5 layers.Dense(1, activation='sigmoid') 6 ]) 7 return model File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/training/tracking/base.py:457, in no_automatic_dependency_tracking.<locals>._method_wrapper(self, *args, **kwargs) 455 self._self_setattr_tracking = False # pylint: disable=protected-access 456 try: --> 457 result = method(self, *args, **kwargs) 458 finally: 459 self._self_setattr_tracking = previous_value # pylint: disable=protected-access File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/engine/sequential.py:113, in Sequential.__init__(self, layers, name) 111 tf_utils.assert_no_legacy_layers(layers) 112 for layer in layers: --> 113 self.add(layer) File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/training/tracking/base.py:457, in no_automatic_dependency_tracking.<locals>._method_wrapper(self, *args, **kwargs) 455 self._self_setattr_tracking = False # pylint: disable=protected-access 456 try: --> 457 result = method(self, *args, **kwargs) 458 finally: 459 self._self_setattr_tracking = previous_value # pylint: disable=protected-access File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/engine/sequential.py:195, in Sequential.add(self, layer) 190 self.inputs = layer_utils.get_source_inputs(self.outputs[0]) 192 elif self.outputs: 193 # If the model is being built continuously on top of an input layer: 194 # refresh its output. --> 195 output_tensor = layer(self.outputs[0]) 196 if len(nest.flatten(output_tensor)) != 1: 197 raise TypeError('All layers in a Sequential model ' 198 'should have a single output tensor. ' 199 'For multi-output layers, ' 200 'use the functional API.') File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/layers/recurrent.py:623, in RNN.__call__(self, inputs, initial_state, constants, **kwargs) 617 inputs, initial_state, constants = _standardize_args(inputs, 618 initial_state, 619 constants, 620 self._num_constants) 622 if initial_state is None and constants is None: --> 623 return super(RNN, self).__call__(inputs, **kwargs) 625 # If any of `initial_state` or `constants` are specified and are Keras 626 # tensors, then add them to the inputs and temporarily modify the 627 # input_spec to include them. 629 additional_inputs = [] File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/engine/base_layer.py:854, in Layer.__call__(self, inputs, *args, **kwargs) 852 outputs = base_layer_utils.mark_as_return(outputs, acd) 853 else: --> 854 outputs = call_fn(cast_inputs, *args, **kwargs) 856 except errors.OperatorNotAllowedInGraphError as e: 857 raise TypeError('You are attempting to use Python control ' 858 'flow in a layer that was not declared to be ' 859 'dynamic. Pass `dynamic=True` to the class ' 860 'constructor.\nEncountered error:\n"""\n' + 861 str(e) + '\n"""') File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/layers/recurrent.py:2548, in LSTM.call(self, inputs, mask, training, initial_state) 2546 self.cell.reset_dropout_mask() 2547 self.cell.reset_recurrent_dropout_mask() -> 2548 return super(LSTM, self).call( 2549 inputs, mask=mask, training=training, initial_state=initial_state) File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/layers/recurrent.py:681, in RNN.call(self, inputs, mask, training, initial_state, constants) 675 def call(self, 676 inputs, 677 mask=None, 678 training=None, 679 initial_state=None, 680 constants=None): --> 681 inputs, initial_state, constants = self._process_inputs( 682 inputs, initial_state, constants) 684 if mask is not None: 685 # Time step masks must be the same for each input. 686 # TODO(scottzhu): Should we accept multiple different masks? 687 mask = nest.flatten(mask)[0] File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/layers/recurrent.py:798, in RNN._process_inputs(self, inputs, initial_state, constants) 796 initial_state = self.states 797 else: --> 798 initial_state = self.get_initial_state(inputs) 800 if len(initial_state) != len(self.states): 801 raise ValueError('Layer has ' + str(len(self.states)) + 802 ' states but was passed ' + str(len(initial_state)) + 803 ' initial states.') File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/layers/recurrent.py:605, in RNN.get_initial_state(self, inputs) 603 dtype = inputs.dtype 604 if get_initial_state_fn: --> 605 init_state = get_initial_state_fn( 606 inputs=None, batch_size=batch_size, dtype=dtype) 607 else: 608 init_state = _generate_zero_filled_state(batch_size, self.cell.state_size, 609 dtype) File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/layers/recurrent.py:2313, in LSTMCell.get_initial_state(self, inputs, batch_size, dtype) 2312 def get_initial_state(self, inputs=None, batch_size=None, dtype=None): -> 2313 return list(_generate_zero_filled_state_for_cell( 2314 self, inputs, batch_size, dtype)) File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/layers/recurrent.py:2752, in _generate_zero_filled_state_for_cell(cell, inputs, batch_size, dtype) 2750 batch_size = array_ops.shape(inputs)[0] 2751 dtype = inputs.dtype -> 2752 return _generate_zero_filled_state(batch_size, cell.state_size, dtype) File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/layers/recurrent.py:2768, in _generate_zero_filled_state(batch_size_tensor, state_size, dtype) 2765 return array_ops.zeros(init_state_size, dtype=dtype) 2767 if nest.is_sequence(state_size): -> 2768 return nest.map_structure(create_zeros, state_size) 2769 else: 2770 return create_zeros(state_size) File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/util/nest.py:536, in map_structure(func, *structure, **kwargs) 532 flat_structure = [flatten(s, expand_composites) for s in structure] 533 entries = zip(*flat_structure) 535 return pack_sequence_as( --> 536 structure[0], [func(*x) for x in entries], 537 expand_composites=expand_composites) File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/util/nest.py:536, in <listcomp>(.0) 532 flat_structure = [flatten(s, expand_composites) for s in structure] 533 entries = zip(*flat_structure) 535 return pack_sequence_as( --> 536 structure[0], [func(*x) for x in entries], 537 expand_composites=expand_composites) File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/keras/layers/recurrent.py:2765, in _generate_zero_filled_state.<locals>.create_zeros(unnested_state_size) 2763 flat_dims = tensor_shape.as_shape(unnested_state_size).as_list() 2764 init_state_size = [batch_size_tensor] + flat_dims -> 2765 return array_ops.zeros(init_state_size, dtype=dtype) File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/ops/array_ops.py:2338, in zeros(shape, dtype, name) 2334 if not isinstance(shape, ops.Tensor): 2335 try: 2336 # Create a constant if it won't be very big. Otherwise create a fill op 2337 # to prevent serialized GraphDefs from becoming too large. -> 2338 output = _constant_if_small(zero, shape, dtype, name) 2339 if output is not None: 2340 return output File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/ops/array_ops.py:2295, in _constant_if_small(value, shape, dtype, name) 2293 def _constant_if_small(value, shape, dtype, name): 2294 try: -> 2295 if np.prod(shape) < 1000: 2296 return constant(value, shape=shape, dtype=dtype, name=name) 2297 except TypeError: 2298 # Happens when shape is a Tensor, list with Tensor elements, etc. File <__array_function__ internals>:180, in prod(*args, **kwargs) File /opt/conda/lib/python3.8/site-packages/numpy/core/fromnumeric.py:3088, in prod(a, axis, dtype, out, keepdims, initial, where) 2970 @array_function_dispatch(_prod_dispatcher) 2971 def prod(a, axis=None, dtype=None, out=None, keepdims=np._NoValue, 2972 initial=np._NoValue, where=np._NoValue): 2973 """ 2974 Return the product of array elements over a given axis. 2975 (...) 3086 10 3087 """ -> 3088 return _wrapreduction(a, np.multiply, 'prod', axis, dtype, out, 3089 keepdims=keepdims, initial=initial, where=where) File /opt/conda/lib/python3.8/site-packages/numpy/core/fromnumeric.py:86, in _wrapreduction(obj, ufunc, method, axis, dtype, out, **kwargs) 83 else: 84 return reduction(axis=axis, out=out, **passkwargs) ---> 86 return ufunc.reduce(obj, axis, dtype, out, **passkwargs) File /opt/conda/lib/python3.8/site-packages/tensorflow_core/python/framework/ops.py:735, in Tensor.__array__(self) 734 def __array__(self): --> 735 raise NotImplementedError("Cannot convert a symbolic Tensor ({}) to a numpy" 736 " array.".format(self.name)) NotImplementedError: Cannot convert a symbolic Tensor (lstm_1/strided_slice:0) to a numpy array. + Code + Markdown + Code + Markdown 4.使用训练好的模型预测文本类型 + Code + Markdown #选做 + Code + Markdown keras关于fit方法中的参数定义如下 def fit(self, x=None, y=None, batch_size=None, epochs=1, verbose=‘auto’, callbacks=None, validation_split=0., validation_data=None, shuffle=True, class_weight=None, sample_weight=None, initial_epoch=0, steps_per_epoch=None, validation_steps=None, validation_batch_size=None, validation_freq=1, max_queue_size=10, workers=1, use_multiprocessing=False): + Code + Markdown

热门推荐

MIss-Y的博客

05-24

1万+

前言：Keras提供众多常见的已编写好的层对象，例如常见的卷积层、池化层等，我们可以直接通过以下代码调用。Keras中的层大致上分为两种类型：第一种是带有训练参数的：比如Dense层、Conv2D层，等等，我们在训练的过程中需要训练层的权重和偏置项；第二种是不带训练参数的：比如dropout层、flatten层、等等，我们不需要训练它的权重，只需要对输入进行加工处理再输出就行了。...

tensorflow回调函数

qq_40297851的博客

01-08

2843

转自 https://keras-cn.readthedocs.io/en/latest/other/callbacks/ 回调函数Callbacks 回调函数是一组在训练的特定阶段被调用的函数集，你可以使用回调函数来观察训练过程中网络内部的状态和统计信息。通过传递回调函数列表到模型的.fit()中，即可在给定的训练阶段调用该函数集中的函数。【Tips】虽然我们称之为回调“函数”，但事...

TensorFlow2.0简要教程（四）-用keras构建自己的网络层

weekdayh的博客

06-29

711

用keras构建自己的网络层文章目录用keras构建自己的网络层1 使用Keras自定义网络层2.使用子层递归构建网络层3.其他网络层配置4.构建自己的模型 1 使用Keras自定义网络层 from __future__ import absolute_import, division, print_function import tensorflow as tf tf.keras.backend.clear_session() import tensorflow.keras as keras impor

Tensorflow基础教程8：自定义层、损失函数和评估指标

iFlyAI的博客

04-20

648

keras中的fit函数参数_一些常见的keras用法

weixin_42628688的博客

12-03

2795

层的自定义 #这里介绍Keras中自定义层及其一些运用技巧，在这之中我们可以看到Keras层的精巧之处。基本定义方法 #在Keras中，自定义层的最简单方法是通过Lambda层的方式：from keras.layers import * from keras import backend as K x_in = Input(shape=(10,)) x = Lambda(lambda x: x+...

keras自定义网络层_（源码解读）

码农的科研笔记

05-28

2546

keras是基于Tensorflow等的一个神经网络的上层框架，通过Keras我们可以简单的构造出自己的神经网络，同时Keras针对主流的算法框架、激活函数和优化函数等进行自己的实现，某些方面只需要我们进行简单的调用，Keras的出现大大简化了网络构建的成本。 Keras自定义网络层需要一下步骤： 1、继承一个Layer keras顶级Layer类定义在engine包的base_laye...

Python __call__详解

柴犬犬舍

08-04

927

问题今天看自己调用EfficientNet的源码发现了这么一段 class DogeNet(nn.Module): def __init__(self): super(DogeNet, self).__init__() model = EfficientNet.from_pretrained('efficientnet-b4') model._fc = nn.Linear(1792, 2) self.effici..

【笔记】就vgg16_bn来谈谈def _call_impl(self, *input, **kwargs)：它位于模块module.py，在net(input)时调用，为fw函数中每步fw搭建配置

nyist_yangguang的博客

07-23

1702

下面给出大致步骤： Conv部分： ——> ——> ——> ——> ——> Linear部分： ——> ——> ——> ——> ——> ——> ...

class Voice_Model(tf.keras.Model): def __init__(self,config): self.config = config super(Voice_Model,self).__init__() self.lstm_1=tf.keras.layers.LSTM(config.num_filters,dropout=0.5,return_sequences=True,unroll=True) self.lstm_2 = tf.keras.layers.LSTM(config.num_filters, dropout=0.5, unroll=True) self.fc= tf.keras.layers.Dense(config.hidden_dim) self.dro = tf.keras.layers.Dropout(0.5) self.outlater = tf.keras.layers.Dense(config.num_classes,activation='softmax') def __call__(self,inputs,training=None,**kwargs): x = inputs x = self.lstm_1(x) x = self.lstm_2(x) x = self.fc(x) x = self.outlater(x) return x

06-03

这是一个 TensorFlow 2.x 中的一个声音识别模型的类定义。这个模型使用了两个 LSTM 层和一个全连接层来提取声音信号的特征，并使用 softmax 激活函数进行分类。在这个类中，`__init__` 方法定义了模型的结构，包括两个 LSTM 层、一个全连接层和一个 dropout 层。其中，`config` 是一个配置对象，用于定义模型的参数。`__call__` 方法定义了模型的计算过程，接收输入 `inputs` 和 `training` 参数，返回模型的输出。首先，输入 `inputs` 经过第一个 LSTM 层，返回一个序列，并输入到第二个 LSTM 层。然后，输出经过一个全连接层，并使用 softmax 激活函数进行分类，返回模型的输出。这个模型是一个标准的声音识别模型，可以用于对声音信号进行分类。

Keras/TensorFlow 中，call(self, inputs, training=None, **kwargs)的使用说明

‌1. 核心作用‌

‌2. 参数详解‌

‌(1) inputs‌

‌(2) training=None‌

‌(1) `inputs`‌

‌(2) `training=None`‌