自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 大数据平台核心技术 学堂在线 雨课堂 第九讲作业答案 人文交流月

逻辑回归属于下列那一类机器学习算法:( )K-means属于下列那一类机器学习算法:( )决策树属于下列那一类机器学习算法:( )GBDT属于下列那一类机器学习算法:( )当前的MPI计算框架和Parameter Server计算框架的最主要区别在于 ( )CAP理论是分布式系统设计领域著名的理论总结,认为CAP三者同时只能满足其二,其中CAP指的是:( )分布式系统实现必须在可能的情况下选择使用最优的硬件。以下硬件中性能最高的是 ( )对于批处理操作,如果分布式文件系统中,文件

2021-07-03 14:17:58 3009

原创 大数据平台核心技术 学堂在线 雨课堂 第八讲作业答案 人文交流月

关于Vertectorization哪些是正确的( )相对于其他编程模型,sql在大数据领域有哪些好处( )哪些部分适合做codegen( )关于内存计算描述不正确的有( )

2021-07-03 14:13:06 2144 1

原创 大数据平台核心技术 学堂在线 雨课堂 第七讲作业答案 人文交流月

下列哪几个系统属于流式计算( )下面对流式描述正确的是( )以下说法哪种正确( )下面对系统雪崩准确的描述有( )对于spark streaming不正确的描述有( )

2021-07-03 14:09:52 2040

原创 大数据平台核心技术 学堂在线 雨课堂 第六讲作业答案 人文交流月

分布式文件系统中最常用的距离计算法则是什么?( )分布式计算过程中,以下哪种计算调度方式代价更小?( )全局数据管理调度主要为了解决哪方面的问题?( )

2021-07-03 14:06:52 1704

原创 大数据平台核心技术 学堂在线 雨课堂 第五讲作业答案 人文交流月

用MergeJOIN的方式在分布式系统上完成2TB“订单表”和100K的省份表在省份ID上的连接,改成IO量(包括跨网络读写和本地外排开销),大约是多少?( )聚合一般需要分成两个阶段进行,第一个阶段中增加Hash-semi aggregate有机会很大的减少两个阶段间的shuffle数据量。计算每个买家订单数量,SELECT Buyer, COUNT(*) FROM Orders GROUP BY Buyer;,如果平均每个买家有三条订单,那么上述优化在最好的情况下shuffle数据量会是未优化前的.

2021-07-03 14:03:47 1908

原创 大数据平台核心技术 学堂在线 雨课堂 第四讲作业答案 人文交流月

下面那种语言是典型的声明式语言?( )下面那种用关系算子实现的MapReduce模型是正确的?( )下面哪个阶段在BSP模型中可以独立并发执行的?( )下面哪些是BSP模型的缺点?( )在ODPSGraph编程模型里,是以什么为核心来编程的?( )下面哪些是函数式编程语言有特点?( )下面对MapReduce编程模型的描述哪些是*错误*的?( )下面哪些是关系型编程模型中的典型算子?( )下面那种工具或软件可以作为关系型计算中的执行引擎?( ).

2021-07-03 13:56:17 3324

原创 大数据平台核心技术 学堂在线 雨课堂 第三讲作业答案 人文交流月

分布式调度类似于PC机的什么部件?( )下面对分布式调度需要解决问题的说法正确的是?( )伏羲分布式调度系统中负责资源调度的角色是?( )为了加快instance运行,通常在调度上采取什么策略?( )伏羲通过什么封装了MapReduce过程中的数据shuffle?( )伏羲的backup instance机制不需要参考的信息是?( )下列关于伏羲资源调度优先级策略的说法错误的是?( )伏羲资源调度支持抢占,下面说法错误的是?( )阿里云伏羲分布式调度系统与社区Hadoop M

2021-06-30 00:18:28 3610 2

原创 大数据平台核心技术 学堂在线 雨课堂 第二讲作业答案 人文交流月

13亿人口,平均每人每年产生的照片和视频存储量为500MB,如果对一年产生的数据进行存储需要什么级别的存储容量( )下面对分布式文件写入方式描述不正确的是( )下面对分布式读取方式描述正确的是( )为保证从分布式存储系统中读取的数据正确,需要采用哪种数据处理方式( )对数据进行Checksum数据校验不需要的数据参数是( )对于数据复制中的两种技术Replication和Rebalance的异同点描述不正确的是( )对于Paxos协议描述不正确的是( )如果想使用Erasure

2021-06-29 21:36:32 3491 1

原创 大数据平台核心技术 学堂在线 雨课堂 第一讲作业答案 人文交流月

蚂蚁金服的贷款业务可以做到( )秒极速审批? 无须人工干预。单一集群规模可以达到( )以上服务器(保持80%线性扩展)ODPS Graph可以支持100亿顶点和( )亿边的规模,支持节点失败自动恢复。ODPS每秒钟创建订单数在2014年双11达到了( )万笔。...

2021-06-24 09:50:51 3046

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除