记录一些自己学习大数据过程中的小笔记


1.Pyspark中print用不了
解决办法:命令行先加入from __future__ import print_function  

2.linux重启断网后,ifconfig显示没有ens33
解决办法:

ifconfig ens33 up
systemctl stop NetworkManager
systemctl disable NetworkManager
ifup ens33
systemctl restart network.service

3. linux中的python安装第三方库一直报错
解决办法:下载文件解压后,再用python setup.py install

4.zepeelin连接hive显示 zeppelininode="/tmp/hadoop-yarn":root:supergroup:drwxrwx---权限不够
解决办法:

注意下各种权限,hdfs dfs -chmod -R 777 /tmp

5.hive中对时间处理,如果时间没有秒钟,无法使用hour函数,可以用concat加上
解决办法:hour(date_format(concat(order_time,':00'),'yyyy-MM-dd HH:mm:ss'))


6.zepeelin启动

解决办法:

start-all.sh
zkServer.sh start
service mysql start
hive --service metastore    #进程需独占一窗口
nohup hive --service hiveserver2 &    #进程需独占一窗口
./zeppelin-daemon.sh start

7.sqoop启动
解决办法:

bin/sqoop list-databases \
 --connect jdbc:mysql://node01:3306/ \
 --username root --password ****

8.sqoop报错  ERROR tool.ExportTool: Error during export
解决办法:mysql后面一定要使用node01(自己的ip地址)
bin/sqoop export     --connect jdbc:mysql://node01:3306/app_didi     --username root     --password *****     --table t_order_total     --export-dir /user/hive/warehouse/app_didi.db/t_order_total/month=2020-04/

9.启动minicoda,使用superset
解决办法:conda activate superset   关闭conda deactivate

10.启动与关闭superset
解决办法:

gunicorn --workers 5 --timeout  120 --bind node01:8787 "superset.app:create_app()" --daemon
ps -ef | awk '/superset/  && !/awk/{print $2}' | xargs kill -9

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值