实现自己的Keras层

最新推荐文章于 2020-08-23 13:14:30 发布

DawnRanger

最新推荐文章于 2020-08-23 13:14:30 发布

阅读量1w

点赞数 11

分类专栏： deep-learning Python

本文链接：https://blog.csdn.net/DawnRanger/article/details/78307244

版权

一. 所有keras层的基类:Layer

keras的所有层的基类定义在keras/engine/topology.py文件中的Layer类中。

python语言基础

用到的装饰器：

@property 让类函数能像类变量一样操作
@interfaces.legacy_xxx_support 让函数支持keras 1.x的 API
@classmothod 类函数，属于整个类，类似于C++/JAVA中的静态函数。类方法有类变量cls传入，从而可以用cls做一些相关的处理。子类继承时，调用该类方法时，传入的类变量cls是子类，而非父类。既可以在类内部使用self访问，也可以通过实例、类名访问。
@staticmethod 将外部函数集成到类体中,既可以在类内部使用self访问，也可以通过实例、类名访问。基本上等同于一个全局函数。

magic函数:

__call__ 让类的实例可以像函数一样调用，正是python的这种特性让我们可以像这样进行层之间的连接：

inputs = Input(shape=(784,))
# 前面的Dense(64, activation='relu')生成了类Dense的一个实例
# 后面的(input)将调用类Dense的__call__函数
x = Dense(64, activation='relu')(inputs)

InputSpec: 确定层的ndim,dtype,shape，每一层都应有一个input_spec属性，保存InputSpec的实例的list(每一个输入tensor都对应一个)

重点关注以下函数

1. add_weight

每层的参数通过这个函数来设定。可以看到它最终调用的是 K.variable 来生成变量，打开 keras/backend/tensorflow_backend.py 可以看到它生成变量的方式：

v = tf.Variable(value, dtype=tf.as_dtype(dtype), name=name)

让人惊讶的是，keras从居然不是使用tf.get_variable的方式生成变量，可见keras在设计时就根本没有考虑到变量共享，从之前的经验来看，要用keras设计多GPU程序是非常棘手的。(要想让Keras支持多GPU并行，必须从这一步开始修改代码，而这里已经是keras非常底层的代码了。)

2. call / call

call是最重要的函数，它用于实现层的功能，子类必须实现。

魔法函数 __call__ 会将收到的输入传递给 call 函数，然后调用 call 函数实现具体的功能。

3. comput_output_shape

根据input_shape 计算输出的shape，子类必须实现。用于自动推断下一层的输入尺寸。

4. build

用来创建当前层的weights，子类必须实现。

5. get_config / from_config

get_config 返回一个字典，获取当前层的参数信息。

from_config 使用根据参数生成一个新的层。代码只有一行：

@classmethod
def from_config(cls, config):
    return cls

最低0.47元/天解锁文章

DawnRanger

关注

11
点赞
踩
37

收藏

觉得还不错? 一键收藏
7
评论
实现自己的Keras层

一. 所有keras层的基类:Layerkeras的所有层的基类定义在keras/engine/topology.py文件中的Layer类中。python语言基础用到的装饰器：@property 让类函数能像类变量一样操作@interfaces.legacy_add_weight_support 让函数支持keras 1.x的 API@classmothod 类函数，属于整个类，类似于C++/
复制链接

扫一扫