大数据面试大保健(1) | liunx&shell

Linux

  • 1.常用高级命令列出5个
ps -ef   查找进程
top      查看内存
df -h    查看磁盘存储情况
iotop    查看磁盘IO读写(yum install iotop安装)
uptime   查看报告系统运行时长及平均负载
iotop -o 直接查看比较高的磁盘读写程序
nestat -tunlp | grep 端口号 查看端口占用情况
ps aux   查看进程

Shell

  • 1.常用工具 (只需要知道名称)
awk,sed,cut,sort  遍历文件夹,读取文件,读取哪行,截取相对应的内容
  • 2.用shell写过哪些脚本
    集群启动 分发脚本
#!/bin/bash
case $1 in
"start"){
    for i in hadoop12 hadoop13 hadoop14
    do
    ssh $1 ""
    done
};;
"stop"){

};;
esac

数仓与mysql的导入导出

  sqoop --连接mysql hadoop12:3306  root   password
        --hdfs 路径    路径存在要删除
        --quary "select id,name from 表 创建时间,操作时间"  and 命令
        全量:where 1=1   增量:创建时间
        新增和变化:创建时间 or 操作时间
        -- 空值处理
        -- 一致性

数仓层级内部的导入 ods -> dwd 5步骤

 #!/bin/bash

#2定义变量
hive=/export/servers/hive/bin/hive
APP=gmall

#3获取时间
if [ -n "$1" ]; then
   do_date=$1
else
   do_date=`date -d "-1 day" +%F`

#4 sql
sql="
  先写12020-09-26
  遇到表,在表前面加上{$APP}.表名
  遇到时间,把时间替换 $do_date
     "
#5 执行sql
$hive -e "$sql"
  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Knight_AL

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值