keras + tensorflow —— 训练参数数目的计算

1. RNN 模型

  • Embedding

    • Embedding(input_dim, output_dim,input_length)
      • input_dim 表示字典的大小;
      • outpu_dim 则表示嵌入的维度;
    • 训练参数的数目为:input_dim✖️output_dim;
    model = Sequential()
    model.add(Embedding(10000, 64, input_length=10))
    input_array = np.random.randint(10000, size=(32, 10))
    	# batch_size 为 32,每一条样本的长度为 10,input_array 的最大值不超过 10000-1,
    model.compile('rmsprop', 'mse')
    output_array = model.predict(input_array)
    assert output_array.shape == (32, 10, 64)
    	# 32 仍为 batch_size
    	# 10,64:则表示输入样本的每一维均映射为 64 维的嵌入向量;
    
  • SimpleRNN

    s t = tanh ⁡ ( U x t + W s t − 1 ) o t = Softmax ( V s t ) \begin{array}{l} s_t=\tanh(Ux_t+Ws_{t-1})\\ o_t=\text{Softmax}(Vs_t) \end{array} st=tanh(Uxt+Wst1)ot=Softmax(Vst)

    则训练参数的数目为:dim(U)+dim(W)+dim(V),如果隐层神经元的数目为 n,输出的维数为 k,输入的维度为 m,也即 U n × m , W n × n , V n × k U_{n\times m}, W_{n\times n}, V_{n\times k} Un×m,Wn×n,Vn×k,训练参数的数目为: n 2 + n m + k n n^2+nm+kn n2+nm+kn,如果考虑到biases,还需加上 n n n

    • 对于 SimpleRNN,计算其可训练参数时,并未计入到输出层的矩阵 V V V,此时训练参数的数目为 n 2 + n m + n n^2+nm+n n2+nm+n
    model = Sequential()
    model.add(Embedding(1000, 64))
    		# 1000*64 ⇒ 64000
    model.add(SimpleRNN(32))
    		# 64*32+32*32+32=3104
    model.summary()
    

    https://stackoverflow.com/questions/50134334/number-of-parameters-for-keras-simplernn

  • GRU

  • LSTM

    • input_dim: m, units: n
    • 可训练参数数目为:4(nm+n+n^2)
    model = Sequential()
    model.add(LSTM(256, input_shape=(16, 4096)))
    	# 4*(4096*256+256+256**2)
    model.summary()
    

2. CNN

  • Conv1D
    • (None, 500, 128),经过 (32, 7)(32 表示 filter 的数量,7 为 kernel size)的一维卷积之后的大小为:(None, 494, 32),训练参数的数目为:712832+32 ⇒ 28704;
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

五道口纳什

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值