简述
- 需求背景
多任务学习的需求比较普遍, 比如给定一篇doc(如 博客, 微博, 短新闻) 的文本信息和数字信息(如 长度, 图片数, 发表日期), 来预测点赞
,转发
,点击率
等若干个回归值. - 为什么可以多任务训练
有些隐藏特征可以共用, 这是各output可以公用前几层的理论假设.
除了一石二鸟, 训练一次实现多种用途以外, 多个 output 之间也会相互平衡, 像正则项一样, 比单一任务达到更好的泛化效果.
网络结构
figure multi-input-multi-output-graph
compile in keras
keras.engine.training.Model#compile(self, optimizer, loss, metrics=None, loss_weights=None,
sample_weight_mode=None, weighted_metrics=None,
target_tensors=None, **kwargs)
- loss
可以传一个list, 对应每个output 的损失函数. - loss_weights
可选的, 指定每个output所用损失函数的权重.
The loss value that will be minimized by the model will then be the weighted_sum of all individual losses.
fit in keras
fit(x,y)
函数中的y传一个list, 与各output对应即可.
参考
- keras official guide doc multi-input-and-multi-output-models