hadoop&hive常用的命令-备忘

http://10.200.200.156:50070/dfshealth.jsp   --dfs容量状态
http://10.200.200.156:50030/jobtracker.jsp    --hadoop任务状态
http://10.200.200.156:50060/logLevel  ---hadoop 日志级别

bin/hadoop fs -cat /
hadoop fs -mkdir /user/xttest
bin/hadoop fs -put /home/searchdata
bin/hadoop fs -ls /user/


mapred.job.map.capacity
mapred.map.tasks

describe regtest;
show partitions wdlog_tmpmap_p_dt;
//行转列
select ads, ip from iploction LATERAL VIEW explode(split(ips,',')) myview as ip;
//导出数据到本地文件
INSERT OVERWRITE LOCAL DIRECTORY '/home/spvdata' select * from wdlog_ready_spv;
--查看hive为某个查询使用多少个MapReduce作业
Explain SELECT sales.*, things.* FROM sales JOIN things ON (sales.id = things.id);
停止某个hive查询
hadoop job -list
hadoop job -kill job_201310162019_0039
hadoop namenode -format
order by 保证整个输出是有序的

sort by 只保证在一个reducer里面是有序的,有可能最终的结果是半序的
Distributing By 所有的数据集,保证相同的key被分配到同一个reducer上,但是他们不保证被聚集在临近的位置

Cluster By Distributing By的基础上保证单个reducer上的数据是有序的
hive -e "SELECT * FROM mwdlog.regex_init" >> /home/hadoop/hadoop/hive-0.10.0/regdata.txt 导出数据

/etc/init.d/iptables stop   关闭防火墙
ln  软连接
shutdown – h now  关机
tar zxvf      --解压缩
unzip wdlog0614.zip ---zip解压缩
unrar e all.rar 
netstat -anp|grep 9002  --查看端口信息
service mysqld  status   --服务状态
ps -ef |grep mysqld   --进程号
mv  hive-log4j.properties hive-log4j.properties.template --重名文件
date   查看系统时间
mkdir auxlib --创建文件夹
---rar软件安装
wget http://www.rarlab.com/rar/rarlinux-x64-5.0.0.tar.gz
tar -zxvf rarlinux-x64-5.0.0.tar.gz
cd rar
make install

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值