spark数据分析基于python语言 中文版pdf_Spark数据分析(基于Python语言英文版)/经典原版书库...

本书详细介绍了使用Spark及其Python API(PySpark)进行大数据分析的基础和高级知识,涵盖Spark核心概念、部署、编程基础、共享变量、数据分区、SQL与NoSQL编程、流数据处理和机器学习等内容,适合数据从业人员和开发人员学习。
摘要由CSDN通过智能技术生成

导语

内容提要

Spark是当今大数据革命的核心,帮助数据从业人员提高各种数据处理、分析任务的效率和性能。在杰夫瑞·艾文著的《Spark数据分析(基于Python语言英文版)/经典原版书库》中,大数据专家Jeffrey Aven介绍了使用Spark及其扩展、子项目,以及更广的生态系统所需的所有知识。

本书讲解了语言无关的Spark基本概念,并使用常用而且直观的PySpark开发环境提供了编程示例。本书专注于Python,因此广大的数据从业人员、分析师和开发人员,即使几乎没有Hadoop或Spark经验,也可以轻松上手。

本书包括从Spark基本编程到高级编程,再到Spark SQL和机器学习的广泛内容。你会学到如何使用Spark高效管理各种形式的数据:流式数据、结构化数据、半结构化数据,还有非结构化数据。在全书中,精准的主题可以让你快速掌握知识点,而扩展性的实践练习可以让你为解决真实问题做好准备。

作者简介

杰夫瑞·艾文(Jeffrey Aven),是一名云计算和大数据方面的咨询师和讲师,常驻澳大利亚,拥有多年在主要的企业级大数据项目中运用Hadoop、NoSQL和Spark等技术的经验。他著有《Teach Yourself Apache Spark in 24 Hours))和《Teach Yourself Hadoop in 24 Hours)),并且获得了CIoudera颁发的亚太及日本地区(APJ)年度Hadoop讲师奖项。

目录

第一部分  Spark基础

第1章  大数据、Hadoop、Spark介绍

1.1

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值