【大数据】大数据运维学习前必须知道的几个常识

  • Consistency(一致性):所有节点上的数据时刻保持同步。

  • Availability(可用性):每个请求都能接收到一个响应,无论响应成功或失败。

  • Partition tolerance(分区容错性):系统应该能持续提供服务,无论网络中的任何分区失效。

在这里插入图片描述

敲黑板:

一个分布式系统不可能同时满足一致性,可用性,和分区容忍性这三个需求,最多同时满足两个。

强一致性: 任何时刻,任何用户都能读取到最近一次更新的数据

单调一致性: 任何时刻,任何用户一旦读到某个数据在某次更新后的值,那么就不会再读到比这个值更旧的值

会话一致性: 任何用户在某次会话中,一旦读到某个数据在某次更新后的值,那么本次会话中就不会再读到比这个值更旧的值。

弱一致性: 用户无法在确定时间内读到最新更新的值

如果我们选择了强一致性,又要满足分区容错性,就势必会牺牲一部分可用性。

注意:

  • CAP理论只适用于分布式系统
CAP理论的典型分布式系统

选择CP: HBASE

选择 AP: zookeeper,HDFS

选择CA: elasticsearch

大数据技术栈
  1. 数据采集和传输层: flume. logstash, sqoop,kafka,pulsar,HUE

  2. 数据存储层: HBase,Kudu, HDFS,

  3. 数据分析层: Spark,flink,Storm, MapReduce,HIVE,Tezpig,mahout,phoenix

  4. OLAP引擎: Druid , Kylin,lmpala, presto

  5. 资源管理层: yarn,kubernetes, mesos

  6. 工作调度器: Oozie , Azkaban

  7. 监测管理: openTSDB ,Ambari,ganglia

  8. 其他: zookeeper,chubby

  9. 文档存储: mongoDB, CouchDB

大数据:注重海量数据存储与处理,基本处于PaaS ,平台即服务

云计算:侧重于硬件资源虚拟化,基本处于LaaS ,基础设施即服务

不过现在的阿里云,亚马逊云等公有云,以及不单单是卖虚拟化的计算资源了,也会涉及到大数据,图像识别,数据库,云安全等,所以现在的云计算已经涵盖了laaS,PaaS,SaaS等方方面面。

除了按照这种技术栈来区分之外,有时候还会按照数据的实时处理程度分为: 批量计算和实时在线技术。

批量计算就是我们常说的离线计算。一次性处理大量数据,吞吐量大,但延时较高。适合数据ETL等场景。

大数据的适用场景

最近跟一家公司对接,他们做的就是大数据的河海农业数据分析。比如展示某一个地区的2010-2020年,10年的降水量。

最近炒得比较火的是交通大数据,实时采集交通信号灯,二氧化碳传感器,汽车位置和速度传感器,以及来自网上的社交媒体的数据,来进行分析。 帮助乘客重新规划路线,节省时间。

金融行业的智慧金融,可以分析客户的数据,来给用户精准提供贷款或者推荐商品。

人工智能,最火的例子就是google的AlphaGo, 人工智能可以进行自主学习,不断完善。 当然除了下棋,还有人脸识别,语音识别,机器翻译,无人驾驶,智能机器人等领域都有很大的威力。

大数据小故事

某比萨店的电话铃响了,客服人员拿起电话。

客服:XXX比萨店。您好,请问有什么需要我为您服务 ?

顾客:你好,我想要一份披萨

客服:先生,烦请先把您的会员卡号告诉我。

顾客:16846146***。

客服:陈先生,您好!您是住在泉州路一号12楼1205室,您家电话是2646****,您公司电话是4666****,您的手机是1391234****。请问您想用哪一个电话付费?

顾客:你为什么知道我所有的电话号码?

客服:陈先生,因为我们联机到CRM系统。

顾客:我想要一个海鲜比萨……

客服:陈先生,海鲜比萨不适合您。

顾客:为什么?

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

img

img

img

img

img

img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)

习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!**

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值