在Hive中使用Avro

最新推荐文章于 2021-07-13 15:17:44 发布

weixin_34001430

最新推荐文章于 2021-07-13 15:17:44 发布

阅读量173

点赞数

文章标签：大数据

原文链接：https://yq.aliyun.com/articles/355622

版权

作者:过往记忆 | 新浪微博：左手牵右手TEL |
可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
博客地址：http://www.iteblog.com/
文章标题：《在Hive中使用Avro》
本文链接：http://www.iteblog.com/archives/1007
Hadoop、Hive、Hbase、Flume等QQ交流群：138615359（已满），请加入新群：149892483

本博客的微信公共帐号为：iteblog_hadoop，欢迎大家关注。
如果你觉得本文对你有帮助，不妨分享一次，你的每次支持，都是对我最大的鼓励

如果本文的内容对您的学习和工作有所帮助，不妨支付宝赞助(wyphao.2007@163.com)一下

Avro（读音类似于[ævrə]）是Hadoop的一个子项目，由Hadoop的创始人Doug Cutting牵头开发。Avro是一个数据序列化系统，设计用于支持大批量数据交换的应用。它的主要特点有：支持二进制序列化方式，可以便捷，快速地处理大量数据；动态语言友好，Avro提供的机制使动态语言可以方便地处理Avro数据。
在Hive中，我们可以将数据使用Avro格式存储，本文以avro-1.7.1.jar为例，进行说明。

　　如果需要在 Hive中使用Avro，需要在$HIVE_HOME/lib目录下放入以下四个工具包：avro-1.7.1.jar、avro-tools-1.7.4.jar、 jackson-core-asl-1.8.8.jar、jackson-mapper-asl-1.8.8.jar。当然，你也可以把这几个包存在别的路径下面，但是你需要把这四个包放在CLASSPATH中。

　　为了解析Avro格式的数据，我们可以在Hive建表的时候用下面语句：

 
    01hive> CREATE EXTERNAL TABLE tweets
 
    > COMMENT "A table backed by Avro data with the 
 
    >        Avro schema embedded in the CREATE TABLE statement" 
 
    > ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.avro.AvroSerDe' 
 
    > STORED AS 
 
    > INPUTFORMAT  'org.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat' 
 
    > OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat' 
 
    > LOCATION '/user/wyp/examples/input/' 
 
    > TBLPROPERTIES ( 
 
    >    'avro.schema.literal'='{ 
 
     本文转自茄子_2008博客园博客，原文链接：http://www.cnblogs.com/xd502djj/p/4089644.html 
     ，如需转载请自行联系原作者。

weixin_34001430

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
在Hive中使用Avro

作者:过往记忆|新浪微博：左手牵右手TEL|可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明博客地址：http://www.iteblog.com/文章标题：《在Hive中使用Avro》本文链接：http://www.iteblog.com/archives/1007Hadoop、Hive、Hbase、Flume等QQ...
复制链接

扫一扫