阿里云数据湖构建(Data Lake Formation,简称 DLF)是一款全托管的快速帮助用户构建云上数据湖及Lakehouse的服务,为客户提供了统一的元数据管理、统一的权限与安全管理、便捷的数据入湖能力以及一键式数据探索能力。DLF可以帮助用户快速完成云原生数据湖及Lakehouse方案的构建与管理,并可无缝对接多种计算引擎,打破数据孤岛,洞察业务价值。
可以将MYSQL中的数据入湖,可以csv入湖,本次讲解csv怎么入湖。
第一步:新建入湖任务
第二步:选择使用csv入湖
第三步:配置csv的oss数据源
第四步:将需要导入的csv放在OSS位置上,注意csv文件是UTF编码,否则数据会乱码
第五步:配置任务信息
第六步:确认任务信息
第7步:执行入湖任务
第8步:数据进入后,可以使用数据检索进行查询
附注:也可以使用数据抽取,一样会读取csv,创建新的数据表和字段,并将值存储进去