自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 分布式计算概述(2)

分布式系统的定义 “分布式系统(distributed system)是建立在网络之上的软件系统。正是因为软件的特性,所以分布式系统具有高度的内聚性和透明性。因此,网络和分布式系统之间的区别更多的在于高层软件(特别是操作系统),而不是硬件” 简单说:分布式系统就是将一群不相干的计算机设备用网络连接起来,把他们视为一个集合,用来处理大批量的数据和复杂的工作,但本质上每台计算机都是相互独立存在的个体机;从软件的角度看,分布式系统是一个整体,但是从硬件看,他们毫无关系。就比如,一个班的同学,是一个班集体,但是

2020-12-22 20:27:20 315

原创 分布式计算概述

分布式计算的概念 “分布式计算是计算机科学的重要研究内容” 其实他真的很重要,怎么说? 他的研究对象主要是分布式(的)系统,一个分布式系统包含多台网络互联的计算机,由这些计算机软硬件资源组成的系统可以处理庞大的数据(项目),它可以理解为一种分而治之的方法。 举个例子,有一个公司接到一个项目订单,但是处理该项目需要用到大量的计算和存储空间,公司的任何一台电脑或服务器都无法满足,怎么办?最直接的办法,去买一块更大的存储空间,换性能更好的处理器,这样可以解决问题,实际上,在分布式系统出现前,人们的确是这样

2020-12-22 20:16:41 564

原创 分布式计算类型(2)

分布式计算类型(2)移动代理范型移动代理是一种可移动的程序或对象。如图2-13所示,在移动代理范型中,一个代理从源主机出发,然后根据其自身携带的执行路线,自动地在网上主机间移动。在每一主机上,代理访问所需的资源或服务,并执行必要的任务来完成其使命。移动代理范型为可移动的程序或对象提供了抽象。这种范型不进行消息互换,而是当程序/对象在各个参与结点间移动时,携带并传递数据。支持移动代理范型的商业软件包有Concordia系统和IBM公司的Agle...

2020-12-22 20:04:47 289

原创 分布式计算类型

分布式计算范型总结消息传递范型客户/服务器范型P2P范型消息系统范型远程过程调用范型分布式对象范型远程方法调用对象请求代理网络服务范型移动代理范型云服务范型消息传递范型消息传递是进程间通信的基本途径,在消息传递范型中,表示消息的数据在两个进程(进程A与进程B)间交换,一个是发送者,另一个是接收者。消息传递同样也是分布式应用的最基本范型,一个进程发送代表请求的消息,该消息被传送到接收者;接收者处理该请求消,并发送一条应答消息。最后该应答消息可能触发下一个请求,并引起下一个应答消息。如

2020-12-12 21:34:11 618

原创 电商大数据分析技术

电商数据分析一、数据来源、分析目的和思路数据来源为了做商品、用户购物行为分析,从阿里云天池搜索获取数据集:(https://tianchi.aliyun.com/datalab/dataSet.html?spm=5176.100073.0.0.30a36fc1OydpSl&dataId=649)该数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(点击、购买、加购、喜欢),数据集信息如下:表1 变量信息编号 变量 说明 数量1 use

2020-12-12 21:30:05 1633

原创 2020-11-25

一Hadop分布式任算系统1.主要用于对大于ITB的海量数据的处理2.Haop采用Java语言开发.是对Goole sMnp Reluce核心技术的开系实现。3.Halop的核心换块包括系统HDFS和分布式计算框架MopRelce,这一结构实现了计算和存储的高度精合,十分有利于面向数据的系统架构,因此已成为大数据技术领域的事实标准._4.文件系统是Hladoop系统的重要组成部分,也是Padaop实现自动并行架的基础,Hadoope收能我为IDBB5.HDFS原型→GFS6.G好为分布式争统,

2020-11-25 10:04:12 413

原创 2020-11-18

虚拟化技术虚拟化技术,通常是指计算元件在虚拟的基础上而不是真实的基础上运行。可以同时运行多个操作系统,而且每一个操作系统中都有多个程序运行,每一个操作系统都运行在一个虚拟的CPU或者是虚拟主机上;可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。中文名虚拟化技术外文名Virtualization性 质一个广义的术语,作 用扩大硬件的容量用 途显著提高计算机的工作效率虚拟化技术应用在Iaas层中从虚小化的描述方面:(1)对象(2)过程 (3)结果优势:(1)提高

2020-11-18 10:07:59 57

原创 2020-10-22

1、数据分析的概念数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总和理解消化,以求最大化地开发数据的功能,发挥数据的作用。2、做数据分析的原因1、有效避免拍脑袋、主观臆想;2、为决策提供支撑,更能说服人;3、通过数据分析,可以看到决策的效果、问题以及未来应该如何做。知乎用户@绡页的答案很简单,但却一语中的:1、“知错能改,善莫大焉”——可是错在哪里,数据分析告诉你。2、“运筹帷幄之中,决胜千里之外”——怎么做好“运筹”,数据分析告诉你。3、“以往鉴来,未卜先知”——怎么发现历

2020-10-22 19:55:00 102

原创 2020-10-21

大数据计算模式PRAM  PRAM模型,即并行随机存取机,也称之为SIMD-SM(共享存储的单指令流多数据流)模型,是一种应用于并行计算抽象模型。PRAM模型是顺序的冯·诺伊曼存储程序模型的自然扩展,由若干具有本地存储器的处理器和一个具有无限容量的共享存储器组成,处理器由公共的时钟进行控制,以同步方式运行。优点:  RPAM结构简单,简便易行;  PRAM能够表达大多数并行算法  PRAM让算法设计变得简单;让并行算法更加容易移植到不同的并行系统上;  可以按需加入一些诸如同步和通信等功能。缺点:  1)

2020-10-21 09:32:38 164

原创 2020-10-20

大数据的4V特征  数据量大Volume、变化速度快Velocity、多类型Variety与高价值Value  1.Volume是大数据的首要特征,数据体量巨大。当今世界需要进行及时处理以提取有用信息的数据数量级已经从TB级别,跃升到PB甚至EB级别。  2.Variety:数据类型繁多。大数据的挑战不仅是数据量的大,也体现在数据类型的多样化。除了前文提到的网络日志、地理位置信息等具有固定结构的数据之外,还有视频、图片等非结构化数据。  3.Velocity:处理速度快。信息的价值在于及时,超过特定

2020-10-20 16:22:06 109

原创 2020-10-13

一 云计算定义美国国家标准与技术研究院(NIST)定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储、应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。类似于生活中的水和电,按量来计算。二、分布式计算概述分布式计算是计算机科学研究的重要内容,主要研究对象是由若干个通过网络联合在一起的计算机组成的硬件系统,这些计算机把需要非常大的计算能力的项目分成许多小部分,然后把小部分

2020-10-13 16:44:36 59

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除