- MaxCompute支持外部表,外部表可以存储在OSS或者TS中
2. ADS无法通过客户端的命令从MaxCompute导入到ADS中
-
不打开GPU无法运行有关图计算算法的组件(如:深度学习组件、网络分析组件)
-
**归并函数(Combiner)将Shuffle阶段相邻的Record进行归并。**用户可以根据不同的业务逻辑选择是否使用归并函数。归并函数是MapReduce计算框架的一种优化。Combiner和Reduce的逻辑一样。当Map输出数据之后,框架会在map端对相同的key值的数据进行本地的归并操作
-
ADS要求一个表组下所有表的一组分区数目相同,一个表组所有表副本数一致
-
DRDS做平滑扩容时,现有的数据库需要满足:拆分表需要有主键、单表需要有主键、单表需要做小表广播
7. Blink是以无界流为数据源进行计算的,具有吞吐量高、延时低、时效性强等特点。数据更新是实时的,按照数据的顺序来处理,而不是按照优先级分配
-
Tunnel命令在上传数据时时自动机密传输
-
MaxCompute SQL不支持事务、索引,也不支持Update或Delete操作,视图和子查询肯定支持,所以不支持事务和主键约束
-
计算型任务会被实例化,非计算型如DDL语句不会被实例化
-
流计算无法从功能上完全替换Oracle存储过程,两者面向问题领域不一样
-
每一个项目空间在创建时,会自动创建一个admin的角色,并且为该角色授予了确定的权限:能访问项目空间中的所有对象,能进行用户与角色管理,能对用户或角色进行授权。与项目空间Owner相比,admin角色不可以将admin权限指派给其他人,不能设定项目空间的安全配置,不能修改项目空间的鉴权模型。Admin角色对应的权限也不能被修改
-
MySql使用的是Binlog日志,SQL server为事务日志
-
OTS的单表可以存储规模较大的数据。目前OTS单表存储的限制是没有上限的,OTS单个分片下所有行的大小总和不能超过1G
-
MinRedundancy表示表组的副本数,默认为2。表组的副本数越多,可以一定程度的增加ADS的最大承受的QPS
-
Substr()函数会将除了boolean类型以外的其他类型隐式转换成string
17. 安骑士具备安全预防、精准防御、资产指纹、日志检索、防网页篡改等功能,网络安全专家是基于阿里云安骑士基础功能推出的带托管服务
- 数据工场Data Works的数据同步支持实时的数据传输
19. MaxCompute没有索引概念,也不支持主键等
- MaxCompute的add jar命令会永久的在project中创建一个资源
21. ADS中如果表的updateType为realtime时,那么只能使用insert和delete,必须指定合法的主键并不能有二级分区
22. 用户购买RDS实例时所选择的内存大小决定了该实例的最大连接数
-
所有的加密服务实例都需要使用用户手里的身份识别卡(USB KEY)进行管理
-
ODPS中,允许的SQL的最大长度为2M
-
Dataworks中的发布管理中,只有任务、资源、函数3类对象可以从开发项目被发布到生产项目
-
DataIDE中可以通过运维中心的任务管理列表进行批量操作的功能:添加报警、修改资源组、修改负责人
-
维度表可以和任意表组的任意表进行关联,并且创建时不需要配置分区信息,但是对单表数据的数据量大小有所限制,并且需要消耗更多的存储资源
-
保存数据为一式三份
-
云盾安全网络具备的功能:DDoS防护功能、WAF应用防火墙、CC防护、网站内容检查
30. 在ADS中,两个事实表进行Join的充要条件是:1)这两个表在一个表组;2)这两个表的Join Key是Hash分区列;3)两张表的Hash分区数必须一致,否则Join结果不准确;4)两张表的Join Key至少有一列建立了HashMap索引,建立在数据量较小的那张表
-
增量同步应设置数据过滤条件,以时间字段未过滤条件实现增量同步。容错记录条数是排除脏数据用的。设置切分键是提升同步速度。作业上限速度是为了设置同步速率,减低源端压力
-
单表的有效最大表尺寸通常受限于操作系统的文件尺寸限制,而不是受MySql内部机制的限制。由于RDS MySql实例的最大尺寸为2TB,因此单表的最大尺寸应略小于2TB。若是RDS MySql有多张表,多张表的总和也不能超过2TB
-
为了保证应用获得可预期的性能,需要设置OTS表的预留读吞吐量和预留写吞吐量
34. BGP机房的优点:
a) 服务器只需要设置一个IP地址,最佳访问路由是由网络上的骨干路由器根据路由跳数与其他技术指标来确定的,不会占用服务器的任何系统资源。服务器的上行路由与下行路由都能选择最优的路径,所以能真正实现高速的单IP告诉访问
b) 由于BGP协议本身具有冗余备份、消除环路的特点,所以当IDC服务商有多条BGP互联网线路时,可以实现路由的相互备份,在一条现路出现故障时,路由会自动切换到其他线路
c) 使用BGP协议还可以使网络具有很强的扩展性可以将IDC网络与其他运营商互联,轻松实现单IP多线路,做到所有互联运营商的用户访问都很快
-
当用户发起一个explain查询到分析型数据库系统后,分析型数据库会抽样一个数据分区来执行计划,并以图形的方式来展现给用户。Explain的resultSet记录中,第一行为逻辑计划,第二行为物理计划
-
RDS实例在只读模式下只能使用drop table、select、show view的命令
-
授权的三要素:主体、客体和操作
-
当RDS只读实例在变更配置时,该只读实例的实例状态为“升降级中”,只读实例在控制台无法进行内外网切换和参数设置两种操作
-
Map Reduce的分片,将输入数据切分为大小相等的数据块
-
RDS的扩展功能有:易用性、高性能、高可用和容灾,实现备份与恢复、高安全性
-
Tunnel SDK中可以同时启动多个request对同一个block进行上传,在保证数据正确上传的基础上,实现并行
-
DMS支持MySql、PostGressQL、ADS、Sql Server
-
数据集成支持源端内置函数转换,同时脚本模式还支持SQL以及多表关联操作
-
大数据计算服务图计算的一次迭代称为一个超步,当迭代终止会满足条件是:
a) 所有点处于结束状态且没有新消息产生
b) 达到最大迭代次数
c) Aggregator的terminate方法返回@true
-
DataHub产品相当于开源Kafka、project项目,项目中由多个topic主题组成,每个topic可以由1个或多个shard分片,数据平衡的存储在shard中
-
ODPS针对字段名、表名均大小写不敏感
-
使用DataX将存储在对象存储OSS中的数据同步至阿里云端大数据计算服务,以OSS的object为粒度进行切分实现并发处理
-
OTS API单行操作:GetRow/PutRow/UpdateRow/DeleteRow;多行数据操作包括:GetRange/BatchGetRow/BatchWriteRow
-
QuickBI支持直接关联
-
调用CreateDBInstance接口创建RDS实例,创建的实例就是主实例;如果通过CreateReadOnlyDBInstance的接口来创建则为只读实例
51. 不同RDS实例中不能资源共享
-
由于沙箱机制的影响,大数据计算服务是无法直接访问本地数据的,可以作为资源上传到大数据计算服务上,通过程序读取资源的方式实现
-
云盾的加密服务,用户可以对密钥进行安全可靠的管理
-
Reduce是接收Map的输出结果进行后续的化简,所以Reduce可以没有
-
实例默认为主动切换,当主实例出现故障无法访问时,则会自动切换到备实例
-
项目管理员不等于项目所有者
-
Hive中用show function来显示所有自定义函数,MaxCompute中用list function来显示所有自定义函数 【show table;list function】
-
绿网内容安全技术是基于阿里云视觉分析技术和深度识别技术,并经过在阿里云经济体内和云上客户多场景的广泛应用和不断优化,可提供风险和治理领域的图像识别、定位、检索等全面服务能力
-
一个reduce的输入数据可能来自于多个map的输出;一个map的输出结果也可能分配到多个reduce中
-
当select中没有limit,最多只能显示5000条数据
-
数据门户也叫数据产品,可以通过菜单形式将仪表板组织成复杂的带导航菜单,常用于专题类分析
-
OTS的主键为string或Binary类型,长度限制为1k
64. 维度和度量可以根据需求相互转换
-
维度表是一种数据量较小但是需要和任何表进行关联的表
-
Java的反射限制:suppressAccessChecks权限被限制,无法setAccessible某个private的属性和方法,以达到读取private属性或调用private方法的目的
-
MySql客户端连接ADS时,端口、服务器地址和AccountID是必要信息
-
创建OTSClient对象,在构造函数中指定endpoint,accessKeyID,accessKeySecret,实例名称
-
DRDS事务支持强一致性
-
Base产品由三大部分组成:
a) 计算平台,提供海量数据的离线计算、实时OLAP、流式计算能力,满足各种场景下的数据计算需求
b) 开发平台,提供一站式的数据集成、数据开发、BI分析、应用开发、数据挖掘和机器学习等工作环境,通过数据中心对数据资产进行集中式管理。加工好的数据,最终以服务接口的形式对接到应用系统
c) 交换平台,提供数据交易市场
-
ODPS MapReduce以及UDF程序在分布式环境中运行时受到Java沙箱的限制,但是在本地运行时&#x