大数据建表语句模板
这篇文章主要写一些大数据数据库所用到建表语句,以备后用
连接大数据集群
beeline中显示Table的完整数据
例如下述语句:
--showHeader=[true|false]:打印查询结果时是否打印表头,默认为 true。
--maxWidth:可显示的最大总宽度,单位:字符数。
--maxColumnWidth:每个字段可显示的最大宽度,单位:字符数。
# 将beeline可显示最大宽度设置为1500个字符,每个字段最长可以显示1500个字符。
beeline -u jdbc:hive2://localhost:10000/default --maxWidth=1500 --maxColumnWidth=1500 --showHeader=false
映射csv文件到外表
drop table holo_text;
create external table holo_text (rowkey string, time string, num int, country int, rd int)
row format
delimited fields terminated by ','
location '/tmp/holo ';
建CSV外表
假设我们有这样一个CSV文件,在本地目录下。文件中数据如下:
field1,"field2-part1
"“field2-part2,
field3-part3”, field3
2field1,“2field2-part1
2field2-part2,
2field3-part3”, 2field3
#对这个文件这样建一张外表
DROP TABLE IF EXISTS csv_table;
CREATE EXTERNAL TABLE csv_table
(
col1 STRING,
col2 STRING,
col3 STRING
)
STORED AS CSVFILE
TBLPROPERTIES(
'field.delim'=',',
'quote.delim'='"',
'line.delim'='\n');
LOAD DATA LOCAL INPATH '/manual_crud_tmp/csv1.txt' OVERWRITE INTO TABLE csv_table;