设每个时间节点输入为
(
x
1
,
x
2
)
(x_1,x_2)
(x1,x2),最后一个节点为(0,0),因为如果有进位的情况则会多一位。
其中
每个时间点 输入的x是二维的,那么u也是二维的,我们设置u为
(
1
,
1
)
T
,
w
=
(
0
,
1
,
0
)
T
(1,1)^T, w =(0,1,0)^T
(1,1)T,w=(0,1,0)T
使用binary activation:
h
t
=
(
b
i
n
a
r
y
c
l
a
s
s
i
f
i
c
a
t
i
o
n
(
z
−
3
)
,
b
i
n
a
r
y
c
l
a
s
s
i
f
i
c
a
t
i
o
n
(
z
−
2
)
,
b
i
n
a
r
y
c
l
a
s
s
i
f
i
c
a
t
i
o
n
(
z
−
1
)
)
h^t = (binaryclassification(z-3),binaryclassification(z-2), binaryclassification(z-1))
ht=(binaryclassification(z−3),binaryclassification(z−2),binaryclassification(z−1))
这样的话,第一个hidden state中,z大于等于3时激活为1,第二个hidden state中则z 大于等于2时激活为1。进位的情况则只需将第二个hidden state传入下一层即可。
对于t时y的输出 ,我们需要对
h
t
h^t
ht进行操作,即binaryclassification(z-3) = 1 或者binaryclassification(z-2) = 0 && binaryclassification(z-1) = 1
经过计算
v
=
(
1
,
−
1
,
1
)
T
v = (1,-1,1)^T
v=(1,−1,1)T即可