【大数据】Hive
自然语言处理-nlp
熟能生巧
展开
-
hive报错
关于这个环境变量。存放在hadoop-env.sh里面。 这个环境变量是hadoop执行程序时会查询class的路径。以前遇到过在本地开发Hbase程序,本地编译通过(本地开发有在IDE里面导入jar包),打包jar包(并未包含开发时的Hbase的lib中的jar包因为考虑到运行linux环境中有这些jar包)然后在linux环境下hadoop jar XXX运行报错不能够找到类。原因是环境中的H...转载 2018-03-15 11:28:00 · 360 阅读 · 0 评论 -
hive配置元数据
Hive的meta数据支持以下三种存储方式,其中两种属于本地存储,一种为远端存储。远端存储比较适合生产环境。Hive官方wiki详细介绍了这三种方式,链接为:Hive Metastore。 一、本地derby这种方式是最简单的存储方式,只需要在hive-site.xml做如下配置便可[html] view plain copy<?xml version="1.0"?> <?xm...转载 2018-03-15 14:40:44 · 892 阅读 · 0 评论 -
hive基础语句
Hadoop Hive基础sql语法Posted on 2015-03-18 09:52 xuzhengzhu 阅读(70731) 评论(0) 编辑 收藏1.先建 表drop table sfmk.xzz_0726_srcarea_desarea;create table sfmk.xzz_0726_srcarea_desarea (srcarea_desarea string) row...转载 2018-03-15 14:54:15 · 5580 阅读 · 0 评论 -
hive启动报错
初次启动hive,解决 ls: cannot access /home/hadoop/spark-2.2.0-bin-hadoop2.6/lib/spark-assembly-*.jar: No such file or directory问题>>提君博客原创 http://www.cnblogs.com/tijun/ <<刚刚安装好hive,进行第一次启动提君博客原创...转载 2018-03-14 14:24:11 · 570 阅读 · 0 评论 -
hive导入csv出现中文乱码问题
在HIVE中序列化的时候需要指定一下字符编码,这是HIVE issue解决办法中找到的。https://issues.apache.org/jira/browse/HIVE-7142。依照这个文档的说明,对指定的表进行设置,即设置序列化编码为GBK,以WINDOW拷贝导入的数据编码相匹配。ALTER TABLE ** SET SERDEPROPERTIES ('serialization.enco...原创 2018-05-31 09:57:13 · 1998 阅读 · 0 评论