最近在总结parquet 相关 的资料,这里对网上资料以及自己的思考做一个总结。 Parquet是面向分析型业务的列式存储格式,由Twitter和Cloudera合作开发,2015年5月从Apache的孵化器里毕业成为Apache顶级项目 列式存储