Spark.ML分类模型之决策树(数据集为KDD99)
环境:IDEA+SBT打包,上传至Spark集群运行
不知如何打包运行的,参照这篇博客博客地址
首先,在项目的build.sbt中添加关于spark.mllib的依赖包。注:需要引用的包见下面完整代码。
"org.apache.spark" % "spark-mllib_2.11" % "2.3.2" % "provided"
然后,大致流程:由于spark.ml是基于DataFrame...
原创
2018-10-30 15:40:00 ·
2099 阅读 ·
1 评论