一般选用 orc 作为 数仓dw 的存储格式
而采用avro的好处如下:
1.数据附带schema
2.hadoop和spark都通用
3.sqoop抽取数据时,使用该格式,可以防止 数据含特殊符号 /t /n /r ,而自动换行
常见的存储格式
最新推荐文章于 2023-11-24 13:23:51 发布
一般选用 orc 作为 数仓dw 的存储格式
而采用avro的好处如下:
1.数据附带schema
2.hadoop和spark都通用
3.sqoop抽取数据时,使用该格式,可以防止 数据含特殊符号 /t /n /r ,而自动换行