1.首先在hive中建表(本人喜欢看NBA所以使用的nba的数据):
create table number_one_team1
(year string comment '年份',
name string comment '球员姓名',
team string comment '球队'
)
comment '每年的状元及选秀球队'
row format delimited fields terminated by ','
stored as textfile;
load data local inpath '/home/data/number_one_team.txt' into table number_one_team1;
2.写shell脚本:
使用html文件和httpd,/var/www/html/这个路径是httpd默认的路径,count.html文件是最后要在web端展示的文件。
简单的写个例子,表示可以使用的方式有很多,灵活转换。
#!/bin/bash
HTML="/var/www/html/guolin/count.html"
#b=`hive -e 'select count(1) from NBA.season_MVP_team;' > /var/www/html/guolin/count.html`
c=`hive -e 'select count(1) from NBA.season_MVP_team;'`
d=`hive -e 'select * from NBA.season_MVP_team;'`
e="NBA.season_MVP_team"
echo "<html>" > $HTML
echo "<body><h2>数据报表</h2>" >> $HTML
echo "<table border=\"1\" bordercolor=\"#000000\" width=\"350\" style=\"BORDER-COLLAPSE: collapse\" >" >> $HTML
echo "<tr style=\"color:White\" bgColor=#0066CC><th>tablename</th><th>count</th></tr>" >> $HTML
echo "<tr align=\"center\" ><td>$e</td><td>$c</td></tr>" >> $HTML
echo "<tr align=\"center\" ><td>数据结果</td><td>$d</td></tr>" >> $HTML
echo "</html>" >> $HTML
3.在Windows上web端打开虚拟机的ip和路径,就可以看到统计数据结果。由于这个不能上传文本,所以我的数据不能上传了,可以随便造数据拿来测试玩。