​大数据和云计算技术周报(第37期)

写在第37期周报


“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。


本期会给大家奉献上精彩的:Spark Streaming、Spark Sort Based Shuffle、Apache Spark、Apache Kylin、深度学习、K-Means、HBase、Redis。全是干货,希望大家喜欢!!!


#大数据和云计算技术社区#希望通过坚持定期分享能帮助同学在大数据学习道路上尽一份微博之力。相信长期坚持认真阅读周报的同学,在技术的道路上一定会日益精进!感谢编辑们的长期坚持!也请同学们继续打赏,支持社区,支持编辑们持续奉献高质量知识!


#大数据和云计算技术社区#长期招募有兴趣参与社区编辑和运营的同学,欢迎扫描文末二维码联系(参与社区工作,收获知识和进步,还有红包哦)。


特别提醒,文末有惊喜!


以下是正文,限于众编辑水平有限,不保证大家都喜欢。

Spark Streaming

自2015年携程实时计算平台搭建以来,经过两年多不断的技术演进,目前实时集群规模已达上百台,平台涵盖各个SBU与公共部门数百个实时应用,全年JStorm集群稳定性达到100%。目前实时平台主要基于JStorm与Spark Streaming构建而成,相信关注携程实时平台的朋友在去年已经看到一篇关于携程实时平台的分享:携程实时大数据平台实践分享。

https://sdk.cn/news/7562

  

Spark Sort Based Shuffle

 本来想把这块外排序的算法完全整理清楚,自己写一下,但是最近确实事儿多,这个文章我大概读完了。虽然文章本身比较早,但是大面上基本把这个事儿能说清楚。最近我把乌斯shuffle 看完,争取自己重新总结一下。

https://blog.csdn.net/mt0803/article/details/50405266

3
Apache Spark

本文将对 Spark 的内存管理模型进行分析  主要模块有 堆内内存  堆外内存  以及task内存  希望大家能够喜欢

https://mp.weixin.qq.com/s/a4jdjJbFFrak8k0jHUBsOA

4
Apache Kylin

 从 2015 年大数据部门成立至今,集群数据存储量为 9PB,服务器规模为 200+ 台。与此同时,数据需求也随着业务的发展落地不断增长,如统计分析、指标 API、运营报表等,不同业务需求差异较大,维度越来越多,需要定制化开发。面对数十亿行级别的数据,低延迟响应的特性,保障服务稳定、数据准确,

http://mp.weixin.qq.com/s/LhtmXXTnYDDCrxdQWCvvUw

5
深度学习

深度学习模型凭借其强大的表达能力和灵活的网络结构在诸多领域取得了重大突破,美团平台拥有海量的用户与商家数据,以及丰富的产品使用场景,也为深度学习的应用提供了必要的条件。本文将主要介绍深度学习模型在美团平台推荐排序场景下的应用和探索。

http://mp.weixin.qq.com/s/jdRu-cishwV8qBmGLTFJCA

6
K-Means

 K-means算法具有悠久的历史,并且也是最常用的聚类算法之一。K-means算法实施起来非常简单,因此,它非常适用于机器学习新手爱好者。首先我们来回顾K-Means算法的起源,然后介绍其较为典型的应用场景。

http://mp.weixin.qq.com/s/7hVypJbpqV7t9-Tig5mK_w

7
HBase

本文基于所给出的样例数据,介绍了将数据从Client写到RegionServer的全流程。

http://mp.weixin.qq.com/s/AORh1vI3L5e7B3MAI8zizg

8
Redis

 搭建任何一个服务,做到“能用”其实是非常简单的,就像我们运行一个单机版的Redis。不过一旦要做到“高可用”,事情就会变得复杂起来。业务中使用了额外的两台服务器,3个Sentinel进程+1个Slave进程,只是为了保证在那小概率的事故中依然做到服务可用。在实际业务中我们还启用了supervisor做进程监控,一旦进程意外退出,会自动尝试重新启动。

https://mp.weixin.qq.com/s/nFreAZJOECjXwFw0HhsAUA


009
开心一刻

 老师要同学们晚上在家里看三集的少年电视剧后,写观后感。

小明没有看电视剧,第二天,他写了一篇两字的作文:“停电!” 

  老师见了,说他撒谎,不可能停电,叫他晚上看第二集后再写一篇。小明还是没看,写了一篇五字的作文:“电视机坏了。”


致谢:

魏宏斌、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉



猜你喜欢




#大数据和云计算机技术社区#博客精选(2017)

NoSQL 还是 SQL ?这一篇讲清楚

阿里的OceanBase解密

#大数据和云计算技术#: "四有"社区介绍

大数据和云计算技术周报(第36期):NoSQL特辑

大数据和云计算技术周报(第35期)

新数仓系列:Hbase周边生态梳理(1)

《大数据架构详解》第2次修订说明

简单梳理跨数据中心数据库

云观察系列:漫谈运营商公有云发展史

云观察系列:百度云的一波三折

云观察系列:阿里云战略观察

超融合方案分析系列(7)思科超融合方案分析

加入技术讨论群




《大数据和云计算技术》社区群人数已经3000+,欢迎大家加下面助手微信,拉大家进群,自由交流。

喜欢钉钉扫码下面的群:


喜欢QQ群的,可以扫描下面二维码:

欢迎大家通过二维码打赏支持技术社区(英雄请留名,社区感谢您,打赏次数超过108+):






  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值