公司笔试题练习AWS

爬网程序可以在单次运行中爬取多个数据存储。完成后,爬网程序会在________________中创建或更新一个或多个表。

解析:

数据目录 or AWS Glue Data Catalog

_________________是用于在AWS Glue 中执行提取、转换和加载 (ETL) 工作的业务逻辑。AWS Glue 将运行一个从源中提取数据、转换数据并将其加载到目标中的脚本。

解析:

作业 or job

配置_________________可帮助 AWS Glue 维护状态信息,并可防止重新处理旧数据。

解析:

        作业书签 or Job bookmark

EMR

对于带有header的csv文件food_establishment_data.csv(包含 2006 年至 2020 年华盛顿州金县卫生部门的检查结果),将 CSV 文件上传到S3 存储桶:demo-emr。以下是数据集中的示例行。

name, inspection_result, inspection_closed_business, violation_type, violation_points

100 LB CLAM, Unsatisfa

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值