42.Spark大型电商项目-用户访问session分析-session随机抽取之本地测试

目录

修改表结构

table session_aggr_stat

session_random_extract

session_detail

top10_category

top10_category_session

spark1.x Iterable和2.x iterator


本篇文章将记录用户访问session分析-session随机抽取之本地测试。

本地测试问题很多,下面就记录一下。

修改表结构

table session_aggr_stat

//删除主键
alter table session_aggr_stat drop primary key;
//设置索引
alter table session_aggr_stat add index idx_task_id (task_id);
//设置字段默认类型
alter table session_aggr_stat change  task_id task_id int(11) NULL;

 

session_random_extract

//删除主键
mysql> alter table session_random_extract drop primary key;
//设置索引
mysql> alter table session_random_extract add index idx_task_id (task_id);
//设置task_id默认为空
mysql> alter table session_random_extract change  task_id task_id int(11) NULL;

session_detail

//删除主键
mysql> alter table session_detail drop primary key;
//添加索引
mysql> alter table session_detail add index idx_task_id  (task_id);
mysql> alter table session_detail add index idx_session_id  (session_id);
//设置task_id默认为空
mysql> alter table session_detail change  task_id task_id int(11) NULL;

 

top10_category

//删除主键
mysql> alter table top10_category drop primary key;
//设置索引
mysql> alter table top10_category add index idx_task_id  (task_id);
//设置task_id默认为空
mysql> alter table top10_category change  task_id task_id int(11) NULL;

top10_category_session

//删除主键
mysql> alter table top10_category_session drop primary key;
//设置索引
mysql> alter table top10_category_session add index idx_task_id  (task_id);
//设置task_id默认为空
mysql> alter table top10_category_session change  task_id task_id int(11) NULL;

spark1.x Iterable和2.x iterator

spark 1.x中的Iterable对象变成了spark2.x中的Iterator对象

相应的,对于返回值为list的RDD,  spark2.x中要返回list.iterator()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值