模型选择 网络结构 损失函数 交叉熵 参数初始化方法: 优化算法: SGDAdamhttps://zhuanlan.zhihu.com/p/32230623 学习率 正则化方法: dropoutBN 转载于:https://www.cnblogs.com/alilliam/p/11420424.html