spark
李时珍皮啊
很皮
展开
-
史上最简单的spark分布式计算教程第一章-快速运行你的第一个spark程序
快速入门spark:史上最简单的spark教程 所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析文档,Elasticsearch官方...原创 2019-03-08 17:26:59 · 20093 阅读 · 6 评论 -
史上最简单的spark教程第十八章-SparkStreaming实时计算核心概念(一)
SparkStreaming的核心架构这篇博客的主要核心就是让大家搞懂spark运行原理和核心架构史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticse...原创 2019-04-12 11:07:06 · 1733 阅读 · 0 评论 -
史上最简单的spark教程第十四章-Spark核心架构之运行原理与架构
spark核心架构史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析文档,Elasticsearch官方文档,实...原创 2019-04-09 10:32:00 · 1985 阅读 · 0 评论 -
史上最简单的spark教程第十五章-spark核心架构之spark-submit详解
Spark核心架构-spark-submit 详解史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析文档,Ela...原创 2019-04-09 11:33:21 · 1762 阅读 · 0 评论 -
史上最简单的spark教程第十三章-SparkSQL编程Java案例实践(终章)
Spark-SQL的Java实践案例(五)本章核心:JDBC 连接外部数据库,sparkSQL优化,故障监测史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasti...原创 2019-04-03 18:58:02 · 2685 阅读 · 2 评论 -
史上最简单的spark教程第十九章-SparkStreaming的转换操作Java代码案例
Streaming的转换操作分为两种无状态转换操作(stateless)再无状态转换操作中,每个批次的处理数据不依赖于之前批次的数据有状态转换操作(stateful)有状态转换操作就是需要依赖于之前批次或者中间结果来计算当前批次的数据reduceByKeyAndWindow可以对每个窗口进行更高效的归约操作,它接收一个归约的函数,在整个窗口上执行**除此之外,spark还提供了很多方便我们计算的函数**比如:countByWindow()或者countByValueAndWindo原创 2019-04-16 16:37:09 · 1977 阅读 · 4 评论 -
史上最简单的spark教程第二十章-spark实时处理数据并且写入外部MySQL,Java代码案例
sparkStreaming输出操作史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析文档,Elastics...原创 2019-04-17 14:18:45 · 2967 阅读 · 0 评论 -
史上最简单的spark教程第二十一章-Spark实时处理kafka消息实现wordCount案例
[提前声明]文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章写作不易,转载请注明,谢谢!代码案例地址:原创 2019-05-06 11:14:39 · 1811 阅读 · 0 评论 -
史上最简单的spark教程第二十二章-初识SparkMLlib机器学习库
[提前声明]文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章写作不易,转载请注明,谢谢!代码案例地址:原创 2019-05-06 14:48:23 · 1746 阅读 · 0 评论 -
史上最简单的spark教程第二十三章-运行第一个机器学习Java和Python代码案例
[提前声明]文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章写作不易,转载请注明,谢谢!代码案例地址:原创 2019-05-07 15:52:49 · 1940 阅读 · 7 评论 -
史上最简单的spark教程第十二章-SparkSQL编程Java案例实践(四)
Spark-SQL的Java实践案例(四)数据源:(读取与存储数据,JDBC服务器)史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,...原创 2019-04-02 15:23:07 · 2355 阅读 · 1 评论 -
史上最简单的spark教程第十一章-SparkSQL编程Java案例实践(三)
Spark-SQL的Java实践案例(三)史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析文档,Elastic...原创 2019-04-02 15:19:08 · 3484 阅读 · 0 评论 -
史上最简单的spark教程第十七章-快速开发部署第一个sparkStreaming+Java流处理程序
第一个流处理程序sparkStreaming+Java史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析文档,...原创 2019-04-11 15:10:37 · 3052 阅读 · 2 评论 -
史上最简单的spark教程第二章-快速开发部署你的第一个Java+spark程序
spark的核心概念(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析文档,Elasticsearch官方文档,实际项目中的应用场景)(帮到到您请点点关注,文章持续更新中!)Git主页 https://github.com/Mydreamandrea...原创 2019-03-12 15:37:11 · 22618 阅读 · 5 评论 -
史上最简单的spark教程第六章-键值对RDD统计,JOIN连接的Java案例实践-(上集)
第六章:键值对RDD的操作键值对RDD的操作用途:聚合,统计,分组史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spa...原创 2019-03-21 11:38:37 · 3701 阅读 · 2 评论 -
史上最简单的spark教程第六章-键值对RDD统计,JOIN连接Java案例实践-(下集)[核心基础完结篇章]
史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析文档,Elasticsearch官方文档,实际项目中的应用场景)...原创 2019-03-21 17:36:59 · 2275 阅读 · 0 评论 -
史上最简单的spark教程第五章-阶段性总结SparkJavaApi,RDD分布式数据集
SparkJavaApi阶段性总结,RDD核心基础概念,常见的转换操作,常见的行动操作原创 2019-03-18 14:11:04 · 3284 阅读 · 1 评论 -
史上最简单的spark教程第三章-深入Java+spark案例,理解RDD分布式数据集
史上最简单的spark教程,java编写spark程序原创 2019-03-13 15:45:49 · 7436 阅读 · 0 评论 -
史上最简单的spark教程第八章-spark的自定义累加器与广播变量Java案例实践
这一章节以恶意请求流量记录作为我们的数据,编写一个完整案例史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析...原创 2019-03-26 10:24:57 · 2688 阅读 · 0 评论 -
史上最简单的spark教程第七章-spark的数据读取与保存Java案例实践
Spark数据读取与保存史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析文档,Elasticsearch...原创 2019-03-22 18:53:51 · 3186 阅读 · 0 评论 -
史上最简单的spark教程第九章-SparkSQL编程Java案例实践(一)斗图王来辣
Spark-SQL啥子是Spark-SQL?这个就比较厉害了,这是一个用来操作结构化,半结构化数据的接口那么什么叫结构化数据呢:结构化数据指的是任何有结构信息的数据,所谓的结构数据,就是每条记录共用的已知的字段集合如果你的数据是这个样子,那么sparkSQL绝对是你的开发首选sparkSQL查询这些数据会更加的简单高效其实更具体的来说,SparkSQL提供了三...原创 2019-03-27 18:56:52 · 7205 阅读 · 6 评论 -
史上最简单的spark教程第十六章-Hadoop-Yarn和独立集群管理(Standalone)
spark部署模式:yarn和独立集群管理史上最简单的spark教程所有代码示例地址:https://github.com/Mydreamandreality/sparkResearch(提前声明:文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章,写作不易,转载请注明)(文章参考:Elasticsearch权威指南,Spark快速大数据分析文档,Elastic...原创 2019-04-10 15:43:12 · 2087 阅读 · 0 评论 -
史上最简单的spark教程第十章-SparkSQL编程Java案例实践(二)
sparksqlJava案例实践* **上一章节的最开始,我们说为了实现sparkSQL的功能,spark提供了一种全新的RDD叫做DataFrame,但是我们的SparkSQL返回值一直是DataSet<Row>,可能有些兄弟就有点不理解了啊*** **Dataset其实是一个分布式的数据收集器*** **而dataframe其实就是一个很多Row的DataSet*** **DataFrame可以从广泛的数据源中构成.比如:结构化的数据文件,Hive的卢姥爷原创 2019-03-28 17:42:35 · 6003 阅读 · 7 评论 -
史上最简单的spark系列教程 | 完结
《史上最简单的spark系列教程》系列:与其说是教程不如说是改良后的个人学习笔记||教程参考自:《spark官方文档》,《spark快速分析》,《图解Spark核心技术与案例实战》,结合个人开发和记录中的坑,整合而成,教程通俗易懂,摒弃大量难懂的理论知识,整合为代码+精简理论的文章,涵盖Kafka,zookeeper,spark,机器学习等多方位知识,帮助你快速入门大数据和机器学习原创 2019-05-07 17:36:51 · 35431 阅读 · 7 评论