导语
“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。
本期会给大家奉献上精彩的:spark、Kafka、Kylin、分布式事务、数据平台、数据分析、图计算。全是干货,希望大家喜欢!!!
1Kafka
LogI-KafkaManager脱胎于滴滴内部多年的Kafka运营实践经验,是面向Kafka用户、Kafka运维人员打造的共享多租户Kafka云平台。专注于Kafka运维管控、监控告警、资源治理等核心场景,经历过大规模集群、海量大数据的考验。
https://mp.weixin.qq.com/s/iLpoKJPK5mlOabZnh8NzgQ
2Kylin
Kylin 4.0.0-beta 正式发布啦!
功能更强大,性能更稳定!
25个新功能及改进:
- System Cube
- 支持 Hadoop 3
- 部分高级函数
- Cube Planner Phase 1
等新特性,拭目以待吧
https://mp.weixin.qq.com/s/OnIkh5k53D9TQBif9ZGw4w
3分布式事务
分布式事务以及分布式锁是分布式中难点,分布式事务一篇文章可能写不完,从基本概念出发,一步一步开始介绍,前面会先梳理事务中一些基本概念,对基本概念十分清楚的话可以直接看"一致性讨论"以及后面的部分。
https://mp.weixin.qq.com/s/Uhjd2DKmxLyjpodrziMhxQ
4数据平台
本文讲解了有关Uber 大型实时数据智能平台建设当面的内容。https://mp.weixin.qq.com/s/tEaPuunOFKVjWZVHWBt-RA
5Spark
本文讲述了在Cloudera CDP 7.1.4中配置支持Spark SQL CLI的方法,及CDH不打包集成Spark Thrift Server原因;
https://mp.weixin.qq.com/s/LM90E9rw1mqodoafchkj8g
6图计算
随着大数据的爆发,图数据的应用规模不断增长,现有的图计算系统仍然存在一定的局限。阿里巴巴拥有全球最大的商品知识图谱,在丰富的图场景和真实应用的驱动下,阿里巴巴达摩院智能计算实验室研发并开源了全球首个一站式超大规模分布式图计算平台GraphScope,并入选中国科学技术协会“科创中国”平台。本文详解图计算的原理和应用及GraphScope的架构设计。
https://mp.weixin.qq.com/s/Qvi1uOxOW1LfLOdMEDj1nQ
7数据治理
数据治理应该是企业顶层设计、战略规划方面的内容,是数据管理活动的总纲和指导,指明数据管理过程中哪些决策要被制定,以及由“谁”来负责,更强调组织模式、职责分工和标准规范。https://mp.weixin.qq.com/s/QaHgP07VFq6goHMvvQtNPQ
8数据分析
Aha时刻主要发生在用户激活阶段,它是用户激活的关键。当用户被吸引来,并不是所有都会转化成活跃用户,但如果用户获得Aha时刻,即从产品中发现了价值,就会顺利转化成活跃用户,而且较容易转化成粘性较高的忠诚用户。
https://mp.weixin.qq.com/s/-X918oxIWyelkNH-ey_EqQ
11开心一刻
有一位嘉宾的父亲是程序员,自己也是程序员,所以自称为“两代单传程序员”,这不叫“两代单传”,这是“继承父类”!
致谢:
周蓬勃、王在道、孙亚飞、冯艺帆、陈少军、邓开表、张少华、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉、郭飞
猜你喜欢
大数据和云计算技术周报(第56期)
加入技术讨论群
《大数据和云计算技术》社区群人数已经6000+,欢迎大家加下面助手微信,拉大家进群,自由交流。
喜欢QQ群的,可以扫描下面二维码:
欢迎大家通过二维码打赏支持技术社区(英雄请留名,社区感谢您,打赏次数超过108+):