![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
《深度实践Spark机器学习 》
大笨笨笨
这个作者很懒,什么都没留下…
展开
-
《深度实践Spark机器学习 》第11章 pyspark决策树模型
由于此书不配代码,以下代码都是本宝宝在ipynb测试过的。原创 2018-07-12 12:02:35 · 2236 阅读 · 1 评论 -
《深度实践Spark机器学习》第8章 构建Spark ML分类模型
8.3 数据探索 spark-shell --num-executors 1 --total-executor-cores 3 --executor-memory 512m val Path = "hdfs://uti04.utidata.com:8020/u01/bigdata/" val raw_data = sc.textFile(Path + "data/train_nohea...原创 2018-07-12 18:38:15 · 817 阅读 · 0 评论 -
《深度实践Spark机器学习》第9章 构建Spark ML回归模型
发现一个好地方:https://www.jianshu.com/p/da2be3876b009.2 数据加载 http://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset # 查看前3行 head -3 hour.csv # 查看记录总数 wc -l hour.csv # 查看文件列数 cat hour.csv | head -1 |...原创 2018-07-13 14:22:19 · 1061 阅读 · 0 评论 -
《深度实践Spark机器学习》第10章 构建Spark ML聚类模型
抓住一只文章:https://www.jianshu.com/p/79a896a5442f10.2 数据加载 http://archive.ics.uci.edu/ml/datasets/Wholesale+customers hdfs dfs -put Wholesale_customers_data.csv /u01/bigdata/data import org.apache.spark...原创 2018-07-13 16:39:15 · 595 阅读 · 0 评论 -
《深度实践Spark机器学习》第13章 使用Spark Streaming构建在线学习模型
抓住一只:https://www.jianshu.com/p/82c95217e42913.3 Spark Streaming应用实例 172 // 先启动nc,端口为9999 nc -lk 9999 // 启动spark-shell spark-shell --num-executors 1 --total-executor-cores 3 --executor-memory 512...原创 2018-07-13 17:28:02 · 704 阅读 · 0 评论