hive编程指南--employees表数据定义

原创 2015年07月07日 17:32:52

hive编程指南中有个employees表,默认的分隔符比较繁杂,编辑起来不太方便(普通编辑器编辑的控制字符^A等被当成字符串处理了,没有起到分隔符的作用)。收集的解决方案如下:

http://www.myexception.cn/software-architecture-design/1351552.html

http://blog.csdn.net/lichangzai/article/details/18703971


切记,简单的文本编辑器编辑如下的内容,分隔符是没被识别的,^A^B^C都会被当成字符串处理,在hive中导入数据会识别不出分隔符,导致一些字段显示null

John Doe^A100000.0^AMary Smith^BTodd Jones^AFederal Taxes^C.2^BStateTaxes^C.05^BInsurance^C.1^A1 Michigan Ave.^BChicago^BIL^B60600


Mary Smith^A80000.0^ABill King^AFederal Taxes^C.2^BState Taxes^C.05^BInsurance^C.1^A100 Ontario St.^BChicago^BIL^B60601


Todd Jones^A70000.0^AFederalTaxes^C.15^BState Taxes^C.03^BInsurance^C.1^A200 Chicago Ave.^BOak Park^BIL^B60700


Bill King^A60000.0^AFederal Taxes^C.15^BState Taxes^C.03^BInsurance^C.1^A300 Obscure Dr.^BObscuria^BIL^B60100


版权声明:本文欢迎转载!

相关文章推荐

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

Hive编程指南-数据类型、DDL、DML、常用字符串函数

摘要:本文主要讲了Hive的数据基本,及一些学用的DDL,DML语句,常用字符串函数。...

《hive编程指南》阅读笔记摘要(三)

第四章 HiveQL:数据定义 hive中的数据库本质上只是表的一个目录或者命名空间,用来组织表 hive有一个默认的数据库default,如果没有显式地指定数据库,默认是default库 创建数...

《hive编程指南》阅读笔记摘要(二)

第三章 数据类型和文件格式 hive中的数据类型包括基本数据类型和集合数据类型(array、map、struct),通常,关系型数据库中没有集合数据类型,而是用关系表关联表示集合。 原因在于:hive...

《hive编程指南》阅读笔记摘要(五)

第6章 HiveQL:查询 查询字段是数组类型的元素数据 select name, subordinates[0] from employees; 查询字段是map类型的元素数据 select nam...

《hive编程指南》学习文档(一)

第一章 基础知识Hive定义1.hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行...

《hive编程指南》阅读笔记摘要(四)

第5章 HiveQL:数据操作 既然hive没有行级别的增删改操作,那么往表中装载数据的唯一途径就是“大量”的数据装载操作,或者通过其他方式仅仅将文件写到正确的目录下。 一、装载数据 LOAD DAT...

《hive编程指南》阅读笔记摘要(一)

第一二章 基础知识、基础操作 hive的缺点 1、hive不支持记录级别的增删改操作,但是用户可以通过查询生成新表或者将查询结果导入到文件中。 2、Hive的查询延时很严重,因为MapReduce ...

《Hive编程指南》学习笔记

以下内容记录了《Hive编程指南》各个章节的主要知识要点,内容会不定期增加 第3章 数据类型和文件格式 Hive支持基本数据类型和struct、map、array三种集合类型,三种集合类型的...
  • du_qi
  • du_qi
  • 2016年07月20日 15:23
  • 391

《hive编程指南》阅读笔记摘要(九)

第10章 调优 一个hive任务会包含有一个或多个阶段stage,不同的stage间有依赖关系。 一、分析复杂的或者执行效率低的查询时,可以使用explain语句,如 explain sel...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:hive编程指南--employees表数据定义
举报原因:
原因补充:

(最多只允许输入30个字)