- calculate方法中,不用加入优化器吗?不需要。calculate就是predict,使用已有模型预测用的。
- din代码中同时包含attention和交叉内积?是的,代码中多处都将交叉内积作为特征。
- 没有看到context特征?确实没有。
- AUGRU在代码中的实现和论文不一致。论文中公式为
u' = a*u
h' = (1-u')*h + u'*c
而代码中是
u = (1.0 - att_score) * u
new_h = u * state + (1 - u) * c
u' = a*u
h' = (1-u')*h + u'*c
而代码中是
u = (1.0 - att_score) * u
new_h = u * state + (1 - u) * c