Java高并发系统设计及其优化策略——秒杀系统(二)

1、项目介绍 该项目是基于SSM框架的一个秒杀系统,采用了CDN技术用于加载静态资源,redis缓存技术承载高并发获取商品信息,针对mysql数据库事务性访问采用了存储过程技术以支撑每秒数万的访问量。 2、技术要点 1、建表的时候采用联合主键,将seckil_id和user_phone作为联...

2018-09-06 22:42:22

阅读数 222

评论数 0

大数据项目(三)————电商模块三(四)

1、模块介绍 Spark作业接收taskid,查询对应的MySQL中的task,获取用户指定的筛选参数;统计出指定日期范围内的,各个区域的top3热门商品;最后将结果写入MySQL表中。 2、需求分析 1、区域信息在哪里,各个城市的信息,城市是不怎么变化的,没有必要存储在hive里?My...

2018-09-06 22:42:12

阅读数 2473

评论数 0

大数据项目(三)————电商模块四(五)

1、广告点击流量实时统计模块 网站 / app,通常会给一些第三方的客户,打一些广告;也是一些互联网公司的核心收入来源;广告在网站 / app某个广告位打出去,在用户来使用网站 / app的时候,广告会显示出来;此时,有些用户可能就会去点击那个广告。 广告被点击以后,实际上,我们就是要针对这种...

2018-09-06 22:42:02

阅读数 1598

评论数 1

大数据项目(三)————电商模块二(三)

1、模块二介绍——页面单跳转化率 页面单跳转化率,计算出来以后,还是蛮有用的,蛮有价值的。 产品经理,可以根据这个指标,去尝试分析,整个网站,产品,各个页面的表现怎么样,是不是需要去优化产品的布局;吸引用户最终可以进入最后的支付页面; 数据分析师,可以基于咱们的这个数据,做更深一步的计算...

2018-09-06 22:41:47

阅读数 767

评论数 0

Spark(九)————数据倾斜解决

1、数据倾斜原理及现象分析 在执行shuffle操作的时候,大家都知道,我们之前讲解过shuffle的原理。是按照key,来进行values的数据的输出、拉取和聚合的。 同一个key的values,一定是分配到一个reduce task进行处理的。 多个key对应的values,总共是9...

2018-09-06 22:41:36

阅读数 198

评论数 0

Spark(八)———— troubleshooting控制

1、控制shuffle reduce端缓冲大小以避免OOM map端的task是不断的输出数据的,数据量可能是很大的。 但是,其实reduce端的task,并不是等到map端task将属于自己的那份数据全部写入磁盘文件之后,再去拉取的。map端写一点数据,reduce端task就会拉取一小...

2018-09-06 22:41:28

阅读数 155

评论数 0

Spark(七)————性能调优

1、分配更多的资源 分配更多资源:性能调优的王道,就是增加和分配更多的资源,性能和速度上的提升,是显而易见的;基本上,在一定范围之内,增加资源与性能的提升,是成正比的;写完了一个复杂的spark作业之后,进行性能调优的时候,首先第一步,我觉得,就是要来调节最优的资源配置;在这个基础之上,如果说你...

2018-09-06 22:41:08

阅读数 200

评论数 0

大数据项目(三)————电商项目模块一(二)

1、用户访问Session介绍 用户在电商网站上,通常会有很多的点击行为,首页通常都是进入首页;然后可能点击首页上的一些商品;点击首页上的一些品类;也可能随时在搜索框里面搜索关键词;还可能将一些商品加入购物车;对购物车中的多个商品下订单;最后对订单中的多个商品进行支付。 用户的每一次操作,其实...

2018-09-06 22:40:52

阅读数 2898

评论数 5

大数据项目(三)————电商项目介绍(一)

1、项目介绍 本项目主要用于互联网电商企业中,使用Spark技术开发的大数据统计分析平台,对电商网站的各种用户行为(访问行为、购物行为、广告点击行为等)进行复杂的分析。用统计分析出来的数据,辅助公司中的PM(产品经理)、数据分析师以及管理人员分析现有产品的情况,并根据用户行为分析结果持续改进产品...

2018-09-06 22:40:14

阅读数 3320

评论数 0

大数据项目(二)————某电信公司通话记录改造

1、项目介绍 将通话记录数据由原来的oracle系统改造成使用大数据架构解决方案。主要使用hbase做通话数据的存储方案。需要将原有oracle数据导入到hbase中,以及新生成数据通过flume收集到kafka,再通过消费者存储到hbase数据库。 hadoop+hbase+flume+zo...

2018-09-06 22:40:02

阅读数 979

评论数 0

大数据项目(一)————生成团购标签

1、项目简介 所谓的团购标签生成就是通过从消费者对商品的评价中统计提取关键词,并统计其消费者对该商品该指标的累积数量,并进行排序显示,类似于淘宝、美团等电商平台都有的大家印象之类的。 2、业务介绍 1、从复杂的json数据格式中提取出评论标签项 2、统计每个评论标签项的数量 3、...

2018-09-06 22:39:48

阅读数 786

评论数 1

Java高并发系统设计及其优化策略——秒杀系统(一)

1、秒杀系统分析 1.1秒杀系统业务分析 1、秒杀系统的核心是对库存的处理,业务流程图如下所示 2、用户针对库存业务分析 1、减库存 2、记录购买明细(记录秒杀成功信息) 1)记录谁购买成功了 2)成功的时间/有...

2018-09-06 22:36:42

阅读数 722

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭