Mr_zhujin-CSDN博客

原创 js中导出table为excel支持大数据量

最近工作中遇到了导出table数据的需求，开始写的函数在小数据量的时候可以正常导出，但数据量过大则报网络错误。后来发现是由于浏览器URL有长度限制数据量大的时候长度超过浏览器GET限制，会部分被阻断了导致下载失败。因此将函数改写为下面的形式，采用Blob对象。//导出数据为Excel的函数const tableToExcel = (function () { //Excel模板...

2020-02-22 21:38:21 827 1

原创 Spark学习笔记—Spark工作机制

一.Spark执行机制1.执行机制总览Spark应用提交后经历一系列转变，最后成为task在各个节点上执行。RDD的Action算子触发job的提交，提交到Spark的Job生成RDD DAG，由DAGScheduler转换为Stage DAG，每个Stage中产生相应的Task集合，TaskScheduler将任务分发到Executor执行。每个任务对应的数据块，使用用户定义的函数进行处...

2020-02-18 13:15:02 1080

一.弹性分布式数据集-RDDRDD是Spark核心数据结构，它是逻辑集的实体，在集群中多台机器之间进行数据分区，通过对多台机器上RDD分区的控制，能够减少数据的重排(data Shuffling)。Spark通过partitionBy运算符对原始RDD进行数据再分配从而创建一个新的RDD。通过RDD之间的依赖关系形成了Spark的调度顺序。1.RDD的几种创建方式：(1).从hadoop文件...

2020-02-16 18:08:50 517

原创 spark学习笔记一

一.spark与hadoop比较Spark是一个计算框架相当于Hadoop的MapReduce。Hadoop中是包含计算框架MapReduce和分布式文件系统HDFS，更广泛的讲是还包含其生态系统上的其他系统比如Hbase和Hive等。Spark相比MapReduce的优点：1.中间结果的输出（1）MapReduce的话计算结果会产生很多stage，并且会依赖底层HDFS文件系统来存储每个...

2020-02-14 21:44:26 286

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Mr_zhujin的博客

原创 js中导出table为excel支持大数据量

原创 Spark学习笔记—Spark工作机制

原创 Spark学习笔记—Spark计算模型

原创 spark学习笔记一

空空如也

空空如也