(林子雨厦门大学)Spark编程基础(Python版) 学习笔记截图
于 2023-05-13 11:03:55 首次发布
该内容探讨了大数据时代的关键技术,包括RDD的创建与操作,如转换和行动操作,以及数据持久化。文章还涉及到了键值对RDD、NoSQL数据库HBase的使用,以及DataFrame在数据处理中的角色。此外,重点讨论了机器学习库MLlib中的逻辑回归和决策树分类器,用于数据分析和预测建模。
摘要由CSDN通过智能技术生成