自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (1)
  • 收藏
  • 关注

原创 Spark-sql与Hive的关系

spark sql 在某些部分是重用的Hive的东西,比如语法解析、元数据存储,到执行计划的翻译部分。HiveQL可以翻译成mapreduce执行,也可以翻译成spark执行计划执行。 在同时安装了Hive和spark时,我使用hive下的beeline执行HQL,执行引擎是mapreuce;使用spark下的spark-beeline执行HQL,执行引擎是spark。 不管是上面哪种方式执行 ...

2017-06-14 23:57:13 1723

原创 Hive-数据文件分隔符为多字符问题

在网上中文搜索出的结果,多半都是过时解决方法,还是推荐google,stackoverflow。 先上结论:如果是0.14以后的版本,直接用MultiDelimitSerde;否则,偏向于先预处理下源数据文件。 1. 如果是Hive 0.14 (2014-12月发布)以后的版本,就可以用MultiDelimitSerde优雅的解决这个问题。     This issue has be

2017-06-14 22:36:15 1041

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除