自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

eiffel_0311的博客

10月 09月 05月 02月 01月

原创 hive streaming

1. hive 的streaming 包括: map(), reduce(), transform()，常用的为transform 2. 恒等变换 select transform(name, salary) using "/bin/cat" as new_name, new_salary from employees where country = 'CHINA';

2016-05-10 20:40:46 75600

原创 Hive 调优

1. 使用 explain 查看执行计划 explain extended select count(distinct(name)) from employees; 2. 调整limit 相关参数一条查询语句如果有limit 限制，他也会扫描整个表 3. 严格模式修改hive-site.xml hive.mapred.mode

2016-05-10 11:03:54 75024

原创 Hive 分区

1. 建立多个表，每个表导入不同的数据 create table test_1 (id int); create table test_2 (id int); create table test_3 (id int); ............ 2. 创建分区表 create table test(id int) partitioned by (name sting);

2016-05-10 08:28:41 76028

原创 HiveQL 查询

1. 创建表 CREATE TABLE employees ( name STRING, salary FLOAT, subordinates ARRAY, deductions MAP, address STRUCT ) PARTITIONED BY (country STRING, state STRING) ROW FORMAT DELIMITED FIELDS TE

2016-05-10 08:28:10 75969

原创 hive 基本操作

一. 简单的表操作 1. 创建一个表 create table test(id int); 2. 从本地导入数据 LOAD DATA LOCAL INPATH '/opt/hive/current/testdata/a.txt' INTO TABLE test; 其中a.txt 内容为： 1 2 3 4 3. 测试数据是否导入

2016-05-06 17:11:31 76972

原创 Hive 安装

1.先决条件要先安装hadoop, 官网下载hadoop-2.7.2.tar.gz 2.安装hive 1）下载hive apache-hive-2.0.0-bin.tar.gz 2）解压 tar -zxzf apache-hive-2.0.0-bin.tar.gz 3）修改/etc/profile文件，添加如下： export HIVE_HOM

2016-05-06 09:54:04 77697

中国5级省市编码爬去整理(统计用区划和城乡划分代码)

中国5级省市编码爬去整理(统计用区划和城乡划分代码)

2019-01-07

PHP开发手册

pHp开发手册，面对php的初级学习者，希望对大家有所帮助

2011-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

eiffel_0311 CSDN认证博客专家 CSDN认证企业博客

码龄16年

IP 属地：北京市

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

59: 原创

5万+: 周排名

208万+: 总排名

406万+: 访问

: 等级

5736: 积分

29: 粉丝

36: 获赞

9: 评论

75: 收藏

私信

关注

热门文章

分类专栏

elasticsearch 1篇
图解 4篇
clickhouse 1篇
spark 3篇
算法 1篇
code demo 3篇
docker 1篇
ruby 8篇
scala 9篇
linux 1篇
python
hive 6篇
postgres
flume 2篇
练习 17篇
爬虫 4篇
其他 1篇

最新评论

短网址简介
skey123123: zzdwz点cn的短网址，免费接口API生成。
IK 分词器空格支持
qq_42630566: 你好，这个第一张图截取的不完整啊！后面|后面是什么呢？然后我后面的没加分词分出来的还是不能完整保留带空格的术语词。
个人建站基本流程
前端宋: 关于腾讯云服务器选择，一看平台，再看配置，最后是机型，我看了网上这篇博文，很全，http://www.aliyunbc.com/newsinfo/1157113.html
redash on spark-thriftserver
面壁者-肖叮: host填什么？
个人建站基本流程
我是海贼王路飞啊: 博主辛苦了！但是这篇文章很多地方没讲清楚。比如说怎样进入命令行模式，怎样搭建数据库等。我摸索了很久，还是没能弄好。最终我还是使用腾讯云开源应用中心(https://app.cloud.tencent.com)，对我这样计算机知识不够丰富的比较友好。

最新文章

提示

确定要删除当前文章？

取消删除