- 博客(3)
- 收藏
- 关注
原创 Hive的常见文件存储格式
在hive中,较常见的文件存储格式有:TestFile、SequenceFile、RcFile、ORC、Parquet、AVRO。默认的文件存储格式是TestFile,在建表时若不指定默认为这个格式,那么导入数据时会直接把数据文件拷贝到hdfs上不进行处理。除TestFile外的其他格式的表不能直接从本地文件导入数据,数据要先导入到TestFile格式的表中,然后再从表中用insert导入到...
2020-03-26 20:38:21 2625
原创 查看Linux物理CPU数量
查看Linux物理CPU数量$cat /proc/cpuinfo | grep ‘physical id’| uniq -c4 physical id : 0
2020-03-26 09:26:11 155
原创 hive框架结构及特点
hive框架结构及特点Hive最初是Facebook为了满足对海量社交网络数据的管理和机器学习的需求而产生的。大数据是互联网的趋势,Hadoop是大数据时代里比较核心的技术,但是Hadoop的MapReduce操作专业性太强,所以在这些的基础上开发了hive框架,毕竟会SQL的人比会java的人多很多。Hive是一个数据仓库应用程序,对存储在HDFS中的数据进行分析和管理;可以将结构化的数据文...
2020-03-23 11:12:02 460
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人