
linux
文章平均质量分 63
黄小耶@
Hello World!
展开
-
大数据相关操作
内部表数据存储位置是由hive.metastore.warehouse决定的,删除内部表会直接删除元数据和存储数据。删除外部表只会删除元数据,不会删除数据本身。分桶就是将表拆分到固定数量的不同文件进行存储,可以减少被操作的数据量,从而提高性能。如果数据在linux本地中,需要加关键字local,如果在HDFS中,则不需要。将数据导出到本地linux需要将local关键字,导出到HDFS不需要。删除分区只是删除元数据中的值,但是HDFS中的分区文件还会存在。:使用Hash取模运算,确认当前数据去哪一个桶。原创 2025-05-20 12:34:35 · 421 阅读 · 0 评论 -
docker基础
【代码】docker基础。原创 2025-03-13 17:02:09 · 1015 阅读 · 0 评论 -
linux常见命令
linux常见命令原创 2024-11-06 11:22:55 · 625 阅读 · 0 评论