java解析avro包_Java实现数据序列化工具Avro的例子

本文介绍了Avro数据序列化系统的基本概念,包括其丰富的数据结构、快速压缩的二进制格式、文件容器、RPC功能和动态语言结合。Avro依赖于模式,允许在不生成代码的情况下进行数据读写和RPC。文章提供了Java实现Avro序列化的实例,包括下载Avro库、创建模式、写入和读取数据的步骤,展示了如何使用Avro处理和存储学生信息。
摘要由CSDN通过智能技术生成

1、Avro简介

Avro是一个数据序列化的系统。

它可以提供:

1)丰富的数据结构类型

2)快速可压缩的二进制数据形式

3)存储持久数据的文件容器

4)远程过程调用RPC

5)简单的动态语言结合功能,Avro和动态语言结合后,读写数据文件和使用RPC协议都不需要生成代码,而代码生成作为一种可选的优化只值得在静态类型语言中实现。

Avro依赖于模式(Schema)。Avro数据的读写操作是很频繁的,而这些操作都需要使用模式,这样就减少写入每个数据资料的开销,使得序列化快速而又轻巧。这种数据及其模式的自我描述方便于动态脚本语言的使用。

当Avro数据存储到文件中时,它的模式也随之存储,这样任何程序都可以对文件进行处理。如果需要以不同的模式读取数据,这也很容易解决,因为两个模式都是已知的。

当在RPC中使用Avro时,服务器和客户端可以在握手连接时交换模式。服务器和客户端有着彼此全部的模式,因此相同命名字段、缺失字段和多余字段等信息之间通信中需要解决的一致性问题就可以容易解决

还有,Avro模式是用JSON(一种轻量级的数据交换模式)定义的,这样对于已经拥有JSON库的语言可以容易实现。

Avro提供着与诸如Thrift和Protocol Buffers等系统相似的功能,但是在一些基础方面还是有区别的,主要是:

1)动态类型:Avro并不需要生成代码,模式和数据存放在一起,而模式使得整个数据的处理过程并不生成代码、静态数据类型等等。这方便了数据处理系统和语言的构造。

2)未标记的数据:由于读取数据的时候模式是已知的,那么需要和数据一起编码的类型信息就很少了,这样序列化的规模也就小了。

3)不需要用户指定字段号:即使模式改变,处理数据时新旧模式都是已知的,所以通过使用字段名称可以解决差异问题。

2、Java例子

1)下载avro jar包:

下载地址 http://www.trieuvan.com/apache/avro/avro-1.8.1/java/

下载avro-1.8.1.jar and avro-tools-1.8.1.jar两个jar包,引入工程;

2)代码:创建模式-输入记录-根据模式获取记录

package sk.ann;<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值