自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 云计算与大数据

第五章数据概念和分类数据概念和分类数据分析是指收集,处理数据并获取数据隐含信息的过程。大数据具有数据量大,数据结构复杂,数据产生速度都快,数据价值密度低的特点,增加了对大数据进行有效分析的难度,大数据分析成为了当前探索大数据发展的核心内容。数据分析主要包括:推测或解释数据并确定如何使用数据;检测数据是否合法;给决策设定合理的建议;诊断或推测错误的原因;预测未来将要发生的事情;数据分析的类型根据数据分析深度,可将数据分析分为丧鹅层次,描述性分析,预测性分析和规则性分析在数据统计=学中,

2020-12-27 13:03:13 307

原创 云计算与大数据

第四章数据仓库数据仓库系统是以数据仓库为核心将各种应用系统的集成在一起,为统一的历史数据分析提供了坚实的平台,通过数据分析与报表模块的查询和分析工具OLAP(联机分析处理),决策分析,数据挖掘完成对信息的提取,以满足决策的学的需要。数据仓库系统通常是指1一个数据库环境,而不是指一件物品。数据仓库系统的体系结构分为源数据层,数据存储与管理层,OLAP服务器层和前端分析工具层。1:数据仓库,它是整个数据仓库环境的核心,是数据存放的地方也提供数据检索的支持。它突出的特点是对海量数据的支持和快速的检索技术。

2020-12-26 17:40:34 126

原创 大数据与云计算概论

第三章*数据变化数据变化可以分为数据概化与属性构造等方法进行属性的变换。数据概化用更抽象(更高层次)的属性来替代底层或原始数据。属性构造构造性的属性并添加到属性集合中以便帮助挖掘。数据集成模式匹配的实质是就是实体识别问题,实体识别就是为了匹配不同的数据源的现实实体,通常元数据为依据进行实体识别,避免模式集成数显错误。每个属性的元数据包括属性名字,含义,数据类型,允许的取值范围,控值规则。元数据还可以用来帮助变换数据。在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,需要注意匹...

2020-12-19 17:02:43 808 1

原创 云计算

云计算的发展背景21世纪初期,崛起的Web2. 0让网络:迎来了新的发展高峰。网站或者业务系统所需要处理的业务量快速增长,例如视频在线或者照片共享网站需要为用户储存和处理大量的数据。这类系统所面临的重要问题是,如何在用户数量快速增长的情况下快速扩展原有系统,随着移动终端的智能化、移动宽带网络的普及,将有越来越多的移动设备进;入互联网,这意味着与移动终端相关的IT系统会承受更多的负载,而列于提供数据服务的企业来讲,IT 系统需要处理更多的业务量。由于资源的有限性,其电力成本、空间成本、各种设施的维护成本快速

2020-12-18 12:19:47 312 2

原创 大数据

大数据第一章云计算的概述什么是云计算定义现今云计算的定义达到100多种,尚且没有一个统一的定义。云计算的领军者如Google,Micronsoft等LI厂商及研究机构,依据各自的利益和各自不同研究视角给出以下理解。云计算是基于互联网的相关服务的增加,使用和交互模式,通常涉及互联网来提供动态易扩张展且经常是虚拟化资源。通俗说云计算是通过大量在云端的计算资源进行计算。 云是网络一种的的比喻说法。在过去在云图中往往表示电信网,后来也用来表示互联网和底层基础设施的抽象 1: 维基百科:云计算是一种动态的

2020-12-18 12:16:34 87

原创 第二章

大数据与云计算概论第二章数据的基础知识数据是各种符号如数字字符等。声音,图片动画,视频多媒体,数据也是原始事实。要保证其原始性和真实性,后期加工才有意义。信息是人们为了某种需求而对原始数据加工重组后形成意义,有用途的数据。信息系统地表达上,可以把数据放到输入端,信息放在输出端。从信息的角度看数据可以从数据的输出的位置得到理解。有图是信息系统的工作方式信息系统的表达上,输入数据输出信息信息系统键盘、移动设备、POS对数据加工处理POS.打印机、显示屏.及各种输入设备及各种输出设备人们掌

2020-12-18 12:15:55 851 1

原创 大数据与云计算概论

大数据的关键技术(1) 数据处理:自然语言处理技术;多媒体内容理解;图文转换技术等。(2)统计和分析: A/B test;地域占比;_文本情感分析;语义分析技术。(3) 数据挖掘:关联规则分析;分类;聚类。(4)模型预测:预测模型;机器学习;建模仿真;模式识别技术等。2.大数据预处理技术(1) 数据采集: ETL (Extract-Transform-Load) 工具。(2)数据存取:关系数据库; NoSQL; SQL等。(3)基础架构支持:云存储;分布式文件系统等。(4) 计算结果展现:

2020-12-18 12:15:35 191

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除