![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 78
AI-Rui
对计算有强烈热爱的同学
展开
-
小白实战学习Spark02----bug汇总
value $ is not a menber of StringContext scala中的Seq 和 Set 的区别 scala中的_和_*的区别原创 2020-05-29 10:50:26 · 200 阅读 · 0 评论 -
小白实战学习Spark02-用决策树算法预测森林植被
决策树算法预测森林植被2.1 回归简介2.2 向量与特征2.3 样本训练2.4 决策树和决策森林2.5 Covtype数据集2.6 准备数据2.7 第一棵决策树数据预处理构建第一个决策树分类模型2.8 决策树的超参数 2.1 回归简介 回归与分类 回归是 预测一个数值型数量 分类是 预测标号或者类别 监督学习:两者都需要从一组输入和输出中学习预测规则(即需要告诉其问题与答案) 2.2 向量与特征 特征:也叫维度 数值型特征:可以用数值进行量化的特征,并且对这些特征排序是有意义的 类别型特征:不原创 2020-05-27 11:20:50 · 1658 阅读 · 0 评论 -
小白学习Spark07-Spark MLlib
Spark MLlib7.1 概述7.2 系统要求7.3 机器学习基础7.4 数据类型7.4.1 操作向量7.5 算法7.5.1 特征提取7.5.2 统计7.5.3 分类与回归7.5.4 聚类7.5.5 协同过滤与推荐7.5.6 降维7.5.7 模型评估7.6 一些提示与性能考量7.6.1 准备特征7.6.2 配置算法7.6.3 缓存RDD以重复使用7.6.4 识别稀疏程度7.6.5 并行度8.总结 7.1 概述 设计理念:把数据以RDD的形式表示,然后再分布式数据集上调用各种算法;即RDD上一系列可供调原创 2020-05-20 22:00:14 · 399 阅读 · 0 评论