Hive:
使用hive cli,只是执行sql语句,并未使用其他的功能,暂时用不上;具体操作了查看数据库、表,使用数据库,查询表,查看表的定义,速度很慢,只是简单的使用。
阅读以前的获取数据的脚本,理解功能,主要就是查询各个表保存到文件中,再使用sed加上表头,虽然很长,但是意思是一样的;其中关于使用—hiveconf设置hive并不明白什么意思,好像是指定队列;还有就是DAY的作用,这个应该与表的内容相关,除此之外并没有什么特别的内容。
之后自己根据这个脚本改写了尝试了查询功能,修改表名、函数名、路径和表头,结果也成功了,至此读取hive中的数据可以说没有问题了。
最后简单看了一下和日志相关的表的定义,有些字段比较多,具体下周正式开始。