六个。
场景解析
为以后的工作选择具体的方法做判断依据。这里选择场景。
如:推荐系统,排序,人群划分等等。不同的场景以后的处理也是不同的。
数据预处理
对数据进行预处理,清洗脏数据。
特征工程
通过算法提取数据的特征。还要判断是否过度提取。
模型训练
用大量的数据对算法进行训练。
模型评估
通过若干指标评估算法。
学习,离线/在线服务
应用了。是接着学习,还是做离线的计算,还是做成在线服务提供出去。