共享单车模拟数据分析
要求如下
库名:hongyaa
表名:bike
字段:
持续时间 duration int,
开始时间 startdate timestamp,(注意时间戳在分析中的细节)
还车时间 enddate timestamp,
开始地编号 startnum int,
开始地名称 startstation string,
还车地编号 endnum int,
还车地名称 endstation string,
自行车编号 bikenum string,
用户类型 type string,(会员/临时会员)
以上面的字段创建一个名为bike的表,要求每一列以“制表符”为分割。
(答案为白色字体,下同)
create table bike (duration int,startdate timestamp,enddate timestamp,startnum int,startstation string,endnum int,endstation string,bikenum string,type string)
row format delimited fields terminated by ‘,’;
检查表的字段:desc bike;(建表是一个得分点,表字段错了后面全做不了)
导入数据:load data local inpath ‘/root/bike.txt’ into table bike;
启用本地计算模式,此举可缩短计算时间,平时可以对比试试看,比赛时建议使用
set hive.exec.mode.local.auto=true;