- 博客(1)
- 资源 (9)
- 问答 (1)
- 收藏
- 关注
原创 基于LR的新闻多分类(基于spark2.1.0, 附完整代码)
自从引进DataFrame之后,spark在ml方面,开始使用DataFrame作为RDD的上层封装,以屏蔽RDD层次的复杂操作,对应用开发者提供简单的DataFrame,以减少开发量。本文以最新的spark2.1.0版本为基础,构建从数据预处理、特征转换、模型训练、数据测试到模型评估的一整套处理流程。
2017-03-04 13:47:29 13983 9
从logstash向elasticsearch导入数据出错
2015-06-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人