自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 大数据平台核心技术 学堂在线 雨课堂 第九讲作业答案 人文交流月

逻辑回归属于下列那一类机器学习算法:( ) K-means属于下列那一类机器学习算法:( ) 决策树属于下列那一类机器学习算法:( ) GBDT属于下列那一类机器学习算法:( ) 当前的MPI计算框架和Parameter Server计算框架的最主要区别在于 ( ) CAP理论是分布式系统设计领域著名的理论总结,认为CAP三者同时只能满足其二,其中CAP指的是:( ) 分布式系统实现必须在可能的情况下选择使用最优的硬件。以下硬件中性能最高的是 ( ) 对于批处理操作,如果分布式文件系统中,文件

2021-07-03 14:17:58 3055

原创 大数据平台核心技术 学堂在线 雨课堂 第八讲作业答案 人文交流月

关于Vertectorization哪些是正确的( ) 相对于其他编程模型,sql在大数据领域有哪些好处( ) 哪些部分适合做codegen( ) 关于内存计算描述不正确的有( )

2021-07-03 14:13:06 2180 1

原创 大数据平台核心技术 学堂在线 雨课堂 第七讲作业答案 人文交流月

下列哪几个系统属于流式计算( ) 下面对流式描述正确的是( ) 以下说法哪种正确( ) 下面对系统雪崩准确的描述有( ) 对于spark streaming不正确的描述有( )

2021-07-03 14:09:52 2061

原创 大数据平台核心技术 学堂在线 雨课堂 第六讲作业答案 人文交流月

分布式文件系统中最常用的距离计算法则是什么?( ) 分布式计算过程中,以下哪种计算调度方式代价更小?( ) 全局数据管理调度主要为了解决哪方面的问题?( )

2021-07-03 14:06:52 1746

原创 大数据平台核心技术 学堂在线 雨课堂 第五讲作业答案 人文交流月

用MergeJOIN的方式在分布式系统上完成2TB“订单表”和100K的省份表在省份ID上的连接,改成IO量(包括跨网络读写和本地外排开销),大约是多少?( ) 聚合一般需要分成两个阶段进行,第一个阶段中增加Hash-semi aggregate有机会很大的减少两个阶段间的shuffle数据量。计算每个买家订单数量,SELECT Buyer, COUNT(*) FROM Orders GROUP BY Buyer;,如果平均每个买家有三条订单,那么上述优化在最好的情况下shuffle数据量会是未优化前的.

2021-07-03 14:03:47 1948

原创 大数据平台核心技术 学堂在线 雨课堂 第四讲作业答案 人文交流月

下面那种语言是典型的声明式语言?( ) 下面那种用关系算子实现的MapReduce模型是正确的?( ) 下面哪个阶段在BSP模型中可以独立并发执行的?( ) 下面哪些是BSP模型的缺点?( ) 在ODPSGraph编程模型里,是以什么为核心来编程的?( ) 下面哪些是函数式编程语言有特点?( ) 下面对MapReduce编程模型的描述哪些是*错误*的?( ) 下面哪些是关系型编程模型中的典型算子?( ) 下面那种工具或软件可以作为关系型计算中的执行引擎?( ) .

2021-07-03 13:56:17 3343

原创 大数据平台核心技术 学堂在线 雨课堂 第三讲作业答案 人文交流月

分布式调度类似于PC机的什么部件?( ) 下面对分布式调度需要解决问题的说法正确的是?( ) 伏羲分布式调度系统中负责资源调度的角色是?( ) 为了加快instance运行,通常在调度上采取什么策略?( ) 伏羲通过什么封装了MapReduce过程中的数据shuffle?( ) 伏羲的backup instance机制不需要参考的信息是?( ) 下列关于伏羲资源调度优先级策略的说法错误的是?( ) 伏羲资源调度支持抢占,下面说法错误的是?( ) 阿里云伏羲分布式调度系统与社区Hadoop M

2021-06-30 00:18:28 3692 2

原创 大数据平台核心技术 学堂在线 雨课堂 第二讲作业答案 人文交流月

13亿人口,平均每人每年产生的照片和视频存储量为500MB,如果对一年产生的数据进行存储需要什么级别的存储容量( ) 下面对分布式文件写入方式描述不正确的是( ) 下面对分布式读取方式描述正确的是( ) 为保证从分布式存储系统中读取的数据正确,需要采用哪种数据处理方式( ) 对数据进行Checksum数据校验不需要的数据参数是( ) 对于数据复制中的两种技术Replication和Rebalance的异同点描述不正确的是( ) 对于Paxos协议描述不正确的是( ) 如果想使用Erasure

2021-06-29 21:36:32 3548 1

原创 大数据平台核心技术 学堂在线 雨课堂 第一讲作业答案 人文交流月

蚂蚁金服的贷款业务可以做到( )秒极速审批? 无须人工干预。 单一集群规模可以达到( )以上服务器(保持80%线性扩展) ODPS Graph可以支持100亿顶点和( )亿边的规模,支持节点失败自动恢复。 ODPS每秒钟创建订单数在2014年双11达到了( )万笔。 ...

2021-06-24 09:50:51 3090

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除