一、定义问题,收集数据集。
注意确保数据集特征丰富程度足以作出预测
二、定义模型预测性能指标
如:平衡分类问题常用精度、接受者操作特征曲线下面积;不平衡分类问题常用精度和召回率;标量回归常用平均绝对误差(MAE)等等。
三、确定模型评估方式
如:留出法、K折交叉验证、乱序重复K折交叉验证
四、数据预处理
预处理目标:
1、特征值为张量数据
2、特征取值较小(0-1区间或正负1区间)
3、特征非异质数据
4、特征缺失处理为0
五、搭建模型
1、确定激活函数、损失函数
问题类型 | 输出层激活函数 | 损失函数 |
---|---|---|
二分类 | sigmoid | binary_crossentropy |
多分类单标签 | softmax | categorical_crossentropy |
多分类多标签 | softmax | binary_crossentropy |
标量回归 | NONE | MAE |