【喜加一】读取parquet文件的metadata并输出成一张表

最新推荐文章于 2024-05-23 17:13:02 发布

某Zz

最新推荐文章于 2024-05-23 17:13:02 发布

阅读量1.6k

点赞数

分类专栏：喜加一

本文链接：https://blog.csdn.net/zhuyuanfu/article/details/86022570

版权

2019-01-07，周一，阴

今天准备做的是将某parquet文件

id: 9
name: 9@asdf
age: 9
group1
  test1: test1
  test2: test2

读成如下的表。

id    name    age    group1.test1    group1.test2
9     9@asdf    9    test1            test2

目前只实现了根数据的读取，group内的数据还不知道怎么取出，一读就错。

代码如下：

package cn.edu.nju.zyf.parquetDemo01;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.log4j.Logger;
import org.apache.parquet.column.ColumnDescriptor;
import org.apache.parquet.example.data.Group;
import org.apache.parquet.example.data.simple.SimpleGroupFactory;
import org.apache.parquet.hadoop.ParquetFileReader;
import org.apache.parquet.hadoop.ParquetFileWriter;
import org.apache.parquet.hadoop.ParquetReader;
import org.apache.parquet.hadoop.ParquetWriter;
import org.apache.parquet.hadoop.example.GroupReadSupport;
import org.apache.parquet.hadoop.example.GroupWriteSupport;
import org.apache.parquet.hadoop.metadata.CompressionCodecName;
import org.apache.parquet.hadoop.metadata.ParquetMetadata;
import org.apache.parquet.schema.*;

import java.io.IOException;


/**
 * @author zhuyuanfu
 * @version 2018-01-03
 * @description just a simple demo for writing and reading parquet files.
 */
public class ParquetWriteAndPrettyPrintingReadDemo {


    private static MessageType getMessageTypeFromCode (){
        MessageType messageType = Types.buildMessage()
                        .required(PrimitiveType.PrimitiveTypeName.BINARY).as(OriginalType.UTF8).named("id")
                        .required(PrimitiveType.PrimitiveTypeName.

最低0.47元/天解锁文章

某Zz

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
【喜加一】读取parquet文件的metadata并输出成一张表

2019-01-07，周一，阴今天准备做的是将某parquet文件id: 9name: 9@asdfage: 9group1 test1: test1 test2: test2读成如下的表。id name age group1.test1 group1.test29 9@asdf 9 test1 ...
复制链接

扫一扫