parquet与schema的那点事
最近做了一个从数据库迁移到parquet报异常的案例,错误如下:
java.lang.IllegalArgumentException:No enum constant org.apache.parquet.schema.OriginalType.nihao total entry:11 java.lang.Enum.valueOf(Unknown Source)
org.apache.parquet.schema.OriginalType.valueOf(OriginalType.java:21)
org.apache.parquet.schema.MessageTypeParser.addPrimitiveType(MessageTypeParser.java:163)
org.apache.parquet.schema.MessageTypeParser.addType(MessageTypeParser.java:112)
org.apache.parquet.schema.MessageTypeParser.addGroupTypeFields(MessageTypeParser.java:100)
org.apache.parquet.schema.MessageTypeParser.parse(MessageTypeParser.java:93)
org.apache.parquet.schema.MessageTypeParser.parseMessageType(MessageTypeParser.java:83)
根据错误内容,很明显就是报No enum constant org.apache.parquet.schema.OriginalType.nihao 的错误。
查看OriginalType的源码定义,支持的type里没有nihao,这就是为什么报错:
https://github.com/apache/parquet-mr/bl