摘要
Schema究竟是什么,Avro和JSON的关系,Avro的序列化与反序列化,对象容器文件。
Schema究竟是什么?
从Apache Avro简介中并不能确切的理解schema究竟是什么。通过阅读官方文档,总结如下:
- schema是一种metadata(元数据,是用于描述数据的数据),用于描述avro数据;
-
schema通过JSON定义,下面是一个record类型的schema:
{ "type": "record", "name": "test", "fields" : [ {"name": "a", "type": "long"}, {"name": "b", "type": "string"} ] }
-
解析avro数据(来自对象容器文件或序列化数据)时,必须根据数据的schema进行分析;
通常,s