2021.1.26课堂笔记(对于hive中的表,提取特征做需求分析)

接1.12日的博客:

create external table locale(
locale_id int,
locale string
)
row format delimited
fields terminated by '\t'
location '/user/event/data/locale';



create external table time_zone(
time_zone_id int,
time_zone string
)
row format delimited
fields terminated by ','
location '/user/event/data/time_zone';


每个用户有多少个朋友?
user_friend
注意点,在重做的时候,记得user_friend表的数据是从hb_user_friend中导入的
create table user_friend
stored as ORC AS
select * from hb_user_friend
但是,bh_user_friend表的数据不是直接通过flume导入Kafka的user_friend_raw
而是通过Kafka stream处理后的数据!!!!
2020.12.08课堂笔记(从flume读取数据连接到Kafka中)  文末附有代码
否则user_friend_raw的形式是event,yes,maybe,invited,no而不是3列
第二个问题:
由于处理字段的时候 invited 的 attend_type 是 invite 而不是 invited
所以和课上的代码有出入,但效果是一样的,只是在类型的时候需要使用 invite 

同样的 event_attendee 的数据也是经过Kafka stream 处理过的。


create table user_friend_count stored as orc as
select user_id,count(1) friend_count from user_friend group by user_id ;


这个事件event_id有多少个朋友user_id邀请了  来,不来,可能来

create table event_attendee_count stored as orc as
select event_id,attend_type,count(1) attend_count
from event_attendee
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值