manifest文件怎么追踪datafile和deletefile
概述
先说结论,通过manifest list和manifest这两个索引文件来追踪
manifest 文件的两种格式
manifest是avro格式的文件,根据其命名和功能可以分为两种:
1:snap-{snapshot_id}-{随机字符串}.avro (manifest list文件)
- 功能:manifest list文件,用于记录manifest文件的路径
- 命名样例:snap-231200337564129518-1-f466c6ac-91f8-477b-8011-9e203b92e6c3.avro
- 内容样例:
manifest_path | manifest_length | partition_spec_id | content | sequence_number | min_sequence_number | added_snapshot_id | added_data_files_count | existing_data_files_count | deleted_data_files_count | added_rows_count | existing_rows_count | deleted_rows_count | partitions |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
/Users/cuiwenxu/Documents/restore/icebergfiles/testupsert/metadata/43 |