我们使用数据库进行分析和建模,最直接的是使用本地保存好的文件直接读取进行统计等操作,实际工作中一般使用存储数据的数据平台进行操作,比较方便的是用可视化平台比如大数据交互平台hue,没当没有可视化平台的时候就需要直接在linux环境中进行操作。这里就归纳一下平时比较实用的命令语句。
linux常用命令
- 查看目前 Linux 系统上的磁盘使用情况统计
df -h #-h 显示大小单位
- 查看当前目录下各个文件及目录占用空间大小
du -sh *
- 修改文件或路径权限
chmod 777 file #777为其他用户可读可写可执行, 600为其他用户不可读写执行
- 查看路径下所有文件包含隐含文件
ll -a
- 创建多级路径
mkdir -p /home/user/data
- 创建空白文件
touch temp.txt
- 为执行命令创建别名
编辑.bashrc文件添加alias命令
alias hive="/usr/bch/1.5.0/hive/bin/beeline -u 'jdbc:hive2://*********'