substract repartition sortedBy collect sum reduce Aggregreate take takeOrder min/max foreach算子底层实现

substract

用cogroup实现 效率低
substract 求差集
在这里插入图片描述

shuffle之后 在每个分区将重复的部分相减 这样比cogroup效率高

如果之前都被同样的分区器分区过了 就不用再shuffle了

substract调用substractbykey 再调用一个substractRDD

repartition coalesce

可以改变分区的数量 ,底层调用coalesce
coalesce 减少分区数量可以不shuffle,但是增加分区数量一定要shuffle
但是分区器变了,是生成一个随机数 作为key分区 更均匀。

sortedBy

是transition算子 但是会触发action 进行全局抽样
在这里插入图片描述
按数据抽样 分区 然后将数据按范围分到不同的分区排序 然后再汇总
再map端进行

collect

在这里插入图片描述
在这里插入图片描述
调用runjob方法 里面的函数 在executor中运行 Array。concat在driver端执行
array是有角标的 所以返回的结果会按顺序排列

count

在这里插入图片描述
在这里插入图片描述

reduce 和 sum

在这里插入图片描述
第一个函数在executor端执行
第二个函数在driver端执行

aggregate

在这里插入图片描述
每个分区应用一次初始值
全局在应用一次初始值

take

按需要触发action
取出的数据在几个分区就触发几个action
take(0)不触发action

takeOrdered

默认升序 排序取出前三个takeOrdered(3)
在map端创造一个有限优先队列 将每个分区的top3放进去
分区之后将队列再相加 得出最大的三个
返回

max min

调用reduce方法 出入比大小函数
不需要shuffle

foreach foreachpartition

在这里插入图片描述

将每一个迭代器应用一下外部的函数

在这里插入图片描述
foreach一个分区应用一下函数

如果要建立连接
foreach要建立很多次 跟mappartitionRDD一样的

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
牙科就诊管理系统利用当下成熟完善的SSM框架,使用跨平台的可开发大型商业网站的Java语言,以及最受欢迎的RDBMS应用软件之一的Mysql数据库进行程序开发。实现了用户在线查看数据。管理员管理病例管理、字典管理、公告管理、药单管理、药品管理、药品收藏管理、药品评价管理、药品订单管理、牙医管理、牙医收藏管理、牙医评价管理、牙医挂号管理、用户管理、管理员管理等功能。牙科就诊管理系统的开发根据操作人员需要设计的界面简洁美观,在功能模块布局上跟同类型网站保持一致,程序在实现基本要求功能时,也为数据信息面临的安全问题提供了一些实用的解决方案。可以说该程序在帮助管理者高效率地处理工作事务的同时,也实现了数据信息的整体化,规范化与自动化。 管理员在后台主要管理病例管理、字典管理、公告管理、药单管理、药品管理、药品收藏管理、药品评价管理、药品订单管理、牙医管理、牙医收藏管理、牙医评价管理、牙医挂号管理、用户管理、管理员管理等。 牙医列表页面,此页面提供给管理员的功能有:查看牙医、新增牙医、修改牙医、删除牙医等。公告信息管理页面提供的功能操作有:新增公告,修改公告,删除公告操作。公告类型管理页面显示所有公告类型,在此页面既可以让管理员添加新的公告信息类型,也能对已有的公告类型信息执行编辑更新,失效的公告类型信息也能让管理员快速删除。药品管理页面,此页面提供给管理员的功能有:新增药品,修改药品,删除药品。药品类型管理页面,此页面提供给管理员的功能有:新增药品类型,修改药品类型,删除药品类型。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值