大数据与云计概论6

大数据与云计算概论6

#简介
现如今,各种类型的数据正在以爆炸性的方式迅速增长,大数据的出现正迫使企业不断提升自身以数据中心为平台的数据处理能力。同时,云计算、虚拟化等技术正不断为数据中心的发展带来新的推动力,并正在改变传统数据中心的模式。本章将介绍数据中心的概念,数据中心的发展历史,数据中心的组成单元一服务器, 以及数据中心的选址及能耗问题。
一、数据中心
1.概念
数据中心是全球协作的特定设备网络,用来在internet网络基础设施上传递、加速、展示、计算、存储数据信息。
2.作用分类
数据中心的意义就在于保障服务器等设备的正常运行,为用户提供相关的网络服务,所以数据中心需要24小时不间断的运作,电力要求方面也比较高。数据中心的数据处理主要有两种,一种是事务处理,一种是数据查询和分析。数据中心对于企业或者用户来说,它实际上就是作为一种业务系统数据储存技术和数据仓库,有时候它的作用也是加强互联网数据的处理速度和效果。所以这个数据中心我们既可以理解为一种服务器的放置场所,也可以理解为一种提供服务器相关服务的地方。
3.发展历程
1945年,由美国生产了第一台全自动电子数字计算机“埃尼阿克”(英文缩写词是ENIAC,即ElectronicNumericalIntegratorandCalculator,中文意思是电子数字积分器和计算器)。它是美国奥伯丁武器试验场为了满足计算弹道需要而研制成的。这台计算机1946年2月交付使用,共服役9年。它采用电子管作为计算机的基本元件,每秒可进行5000次加减运算。它使用了18000只电子管,10000只电容,7000只电阻,体积3000立方英尺,占地170平方米,重量30吨,耗电140~150千瓦,是一个名副其实的庞然大物。在革命性的开启了人类计算新时代的同时,也顺带开启了与之配套的数据机房的演进。

事实上,从发明计算机到目前网络盛行的横跨60余年的大的时间尺度来看,人类社会的计算方式经历了从集中主机要分散运算要再次集中的过程,这个过程当然不是简单的往复的过程,具体如下:

第一阶段:1945-1971年代,计算机器件组成主要以电子管,晶体管为主,体积大,耗电大,主要运用于国防机构,科学研究等军事或者准军事机构。由于计算消耗的资源过大,成本过高,因此计算的各种资源集中也就是必然的选择。同时,也诞生了与之配套的第一代的数据机房。UPS,精密机房专业空调就是在这个时代诞生。

第二阶段:1971-1995年代,随着大规模集成电路的迅速发展,计算机除了向巨型机方向发展外,更多地朝着小型机和微型机方向快速演进。1971年末,世界上第一台微型计算机在美国旧金山南部的硅谷应运而生,它开创了微型计算机的新时代。在这个时代,计算的形态总的来说是分散为主,分散与集中并存。因此,数据机房的形态也就必然是各种小型,中型,大型机房并存的态势,特别是中小型机房得到了爆炸式的发展。

第三阶段:1995-现今,互联网的兴起被示为计算行业从发明计算机之后的第二个里程碑。互联网的兴起本质上是对计算资源的优化与整合。而对人类社会分散计算资源的整合是计算发展本身的内在的要求与趋势。本阶段计算资源再次集中的过程绝不是对第一阶段的简单复制,有两个典型的特点:一是分散的个体计算资源本身的计算能力急速发展,比如摩尔定律和其后的多核技术就是典型的应用,二是个体计算资源被互联网整合。而这种整合现在也成了一个关键环节,因此也会不断的演进。顺着上述两条思路我们看现今的热点:INTEL和AMD的白热化竞争,刀片服务器,互联网宽带,IPV6,虚拟化,云计算等等均在上述思路覆盖之中。

4.组成及建设
一 .数据的全面性和来澡的唯一性 数据中心的建设并不针对某一特定的业务应用场景,应按照模型驱动的方 式来收集整理数据,应按照企业的信息建立统一的数据地图,同时将数据按照 统一归口管理的方式分发到各业务部门,数据具有唯一的出口。
二,保证系统的开放性和可扩展性 数据中心建设是一个复杂的系统工程,需要分阶段建设和实施 ,建设内容 将涉及企业内部现有数据和未来可扩展数据,可能需要向不同的业务应用提供 标准的数据内容。这就要求系统具备开放性来接受未来变化的数据 ,具备可扩 展性来满足未来可能的业务应用。 数据中心建设从系统架构、软硬件平台的选择、系统设计、数据内容收集整 合以及建设管理过程等方面都应注重系统的开放性和可扩展性。
三、 现阶段国内企业正处于发展和信息化进行的快车道上,业务应用演进迅 速 ,同时企业合并收购进程较快。在数据中心的建设方面 ,要充分考虑这些情 况,建立灵活的应用,以适应变化的业务管理模式和业务规则发展。 在数据中心建设中考虑各种变化,在系统框架设计、功能设计、处理模式、 接口方式、部署方式等方面具备足够的灵活性 。
二、数据中心的基本单元–服务器
服务器的关键组成器件有处理器、内存和I/O接口,其使用方法的不同,衍生出多种架构。按照处理器之间的关系,可以分为非对称多处理架构(Asymmetrical Multi-Processing,AMP)和对称多处理架构(Symmetrical Multi-Processing,SMP);按照内存访问的方式,可以分为统一内存访问架构(Uniform Memory Architecture,UMA)和非统一内存访问架构(Non-Uniform Memory Architecture,NUMA);按照I/O之间的关系,又有大规模并行处理架构(Massively Parallel Processing,MPP)
三、数据中心选址
现实中,有许多因素影响企业数据中心选址的因素。而所有这些因素都应该从战略的角度来看,因为现如今,一个行业的重点可能会每隔3至5年发生改变;而每隔7至10年,需要转换或更新采用新的技术。在下文中,一一介绍了影响数据中心选址的各种因素:

地理位置:首先,也是最重要的因素便是数据中心的地理位置。这在决策的一开始就应该被充分进行考量。需要分析的因素包括:在备选址地点发生自然灾害的概率和频率(洪水、飓风、龙卷风等);环境危害因素(数据中心对于其所在地环境影响的程度);以及气候因素(数据中心备选址地点的气候是否有免费的外部空气冷却——将是额外的一个非常好的优势资源。

电力能源供应:电力或动力关于也是很重要的因素之一,因为其是数据中心设施经营成本的主要成分之一。我们需要了解的因素包括:可用性——在了解当地电力供应情况的同时,我们需要权衡备选地点是否有多个成熟的电网;成本因素——我们还需要比较各种电力成本??。也就是说,每千瓦时的动力源的成本应该足够低;具备替代的能源——决策管理层还需要考虑备选地点是否有诸如太阳能、风能、空气等可再生的能源,这将有助于企业打造更加绿色的企业形象。

通讯基础设施:数据中心的通信问题也是最重要的组成部分之一。数据中心选址时,需要从通信基础设施的角度需要考虑各种因素。如:光纤主干线路及其距数据中心选址的距离。这将有助于衡量从光纤主干线路到数据中心选址所需投资的确切数据;光纤类型,这会影响传输速度;所在地通讯服务运营商的类型及其支持的服务模式;延迟因素,传输和交付延迟时间也将是一个重要的因素。

税率:另一个重要方面是备选地点的政府税率问题。需要考虑的因素包括:物业税、企业税和销售税。

建筑因素:在任何特定的位置建设一个数据中心,建设成本亦发挥了重要作用。在企业做出数据中心的选址决策之前,应从以下几个方面考虑:该地区建筑行业的成熟度、是否有数据中心的建设经验、相关的建筑技术是否到位、当地的建筑工人是否到位、劳动力成本是否是在企业的可承受范围内。

交通运输:各种运输方式的可用性也是数据中心选址的影响因素之一。数据中心的设备必须交付,而工人和相关的供应商也需要便捷的交通达到数据中心所在地。

生活成本:数据中心所在地的生活成本也应该成为企业数据中心选址的一个重要因素。
四、据中心的能耗
人类面临能源短缺现象是个不争的事实 ,节约能源与环境保护是当前人类发展的最重要的战略任务,所以在全世界范围内,不分国籍种族性别、工作性质,大家已经形成了一个共识“绿色经营理念”。当前企业和机构的数据中心大都面临日益严峻的高能耗挑战。据统计,85%以上的机房存在过度能耗问题,供给数据中心的电力只有1/3 用在IT设备上,散热和基础设施其它设备能耗则占到2/3.因此,降低基础设施能耗已经成为大型数据中心建设的关键问题之一。

人们看到了数据中心节能降耗的紧迫性、长期性和复杂性。同时还要清醒的认识到降低数据中心能耗的工作是一个艰苦而漫长的过程。首先,要搞清楚数据中心基础设施能耗的去向,各子系统的能耗状况和降低能耗的潜力,并在此基础上制定出综合治理的策略。
难题包括:
(1)数据中心的需求多样化,且不断变化;

(2)IT设备功率密度迅速增长,对供电和制冷功能提出了更高的要求;

(3)未来容量和密度的不确定性,给数据中心规划设计带来困难;

(4)可用性的期望值越来越高,增加了供电和制冷的难度和复杂性;

(5)IT技术迅速变化,对数据中心的适应性要求越来越高;

(6)数据中心预算不断增加,为节能计划和实施带来困难;

降低数据中心能耗问题的严重性是最近几年才提出的,不管是在对节能降耗的重要性的认识方面,还是在节能降耗的实施策略方面,都是一一个不断学习研究探讨的过程。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大数据概论是指对海量的、复杂的、高维度的数据进行收集、处理和分析的一门学科。随着信息技术的快速发展,大量的数据被产生和积累,想要从这些数据中获得有价值的信息和洞察力,就需要借助大数据概论的方法和技术。 大数据概论主要包括以下几个方面。首先是大数据的处理和存储技术,包括分布式存储系统、并行计算框架、分布式文件系统等。这些技术可以帮助我们有效地存储和处理大规模的数据。其次是数据挖掘和机器学习的方法,通过这些方法可以从大数据中发现隐藏的模式和规律,并用于预测和决策。此外,数据可视化和探索性数据分析也是大数据概论的重要内容,通过可视化技术可以将复杂的数据转化为直观的图表和可视化图像,帮助人们更好地理解和分析数据。 大数据概论在各个领域都有广泛的应用。在商业领域,大数据概论可以帮助企业分析市场趋势、预测产品需求,并进行个性化推荐和营销策略优化。在金融领域,大数据概论可以用于风险控制和反欺诈,帮助银行和保险公司降低风险和损失。在医疗领域,大数据概论可以用于疾病预测和诊断,辅助医生做出更准确的诊断和治疗方案。 总之,大数据概论是一门应用于处理和分析大数据的学科。它涵盖了数据处理和存储技术、数据挖掘和机器学习方法,以及数据可视化和探索性数据分析等方面。通过应用大数据概论的方法和技术,可以从海量的数据中提取有价值的信息和知识,为各个领域带来新的机遇和挑战。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值