- 博客(3)
- 资源 (25)
- 收藏
- 关注
原创 spark2.0从入门到精通(一)
。RDD介绍 。Spark基本工作原理 。Spark开发入门 。编写WorkCount程序 。使用本地模式进行测试 。使用spark-submit提交到集群运行(spark-submit仓用参数说明) 。Spark程序开发流程总结 。sark-s...
2018-09-03 17:46:34
1310
1
原创 spark大型项目实战:电商用户行为分析大数据平台(一)
标签:spark,大数据,电商,用户行为 项目介绍: 本项目主要用于互联网电商企业中,使用spark技术开发的大数据统计分析平台,对电商网站的各种用户行为(访问行为,购物行为,广告点击行为等)进行复杂的分析。用统计分析出来的数据,辅助公司中的pm(产品经理),数据分析师以及管理人员分析现有产品的情况,并根据用户行为分析结果持续改进产品的设计,以及调整公司的战略和业务,最终达到用大数据技术来帮助...
2018-08-29 19:36:27
6397
原创 mycat(数据库中间件)实践操作以及问题总结
就我目前的对mycat的掌握而言,mycat主要用于分库和分表 这里重点对分表进行叙述,分表按照分片规则分为很多种,但常见的有两种 1:当id为int类型时,按照范围进行分表,0-50W,50-100W,100-150W 2:当id为string类型时,采用hash一致进行分表, 问题1:navicat连接mycat时错误,查阅各种资料解决问题,耗费5小时 最后发现navicat12不行...
2018-08-27 21:43:11
676
数据模型V1.0.docx
2020-08-27
大数据操作系统产品白皮书V4.0.docx
2020-08-27
大数据平台安全加固措施.docx
2020-07-22
hue的安装配置.doc
2019-07-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人