![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
tianzongnihao
这个作者很懒,什么都没留下…
展开
-
Hadoop分布式系统集成架构
一、概念 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。(发音 是:[hædu:p]) http://hadoop.apache.org/ Hadoop Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。 HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(...转载 2018-08-22 10:28:33 · 3456 阅读 · 0 评论 -
大数据-内存单位
“大数据”作为时下最火热的IT行业的词汇,随之数据仓库、数据安全、数据分析、数据挖掘等等围绕大数量的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。笔者愚钝,大数据有多大,一直没有清晰的概念,故此简单的科普研究,分享至此: 最小的基本单位是Byte应该没多少人不知道吧,下面先按顺序给出所有单位:Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB 我只知道前五个,估计大多数...原创 2018-08-28 15:19:06 · 1297 阅读 · 1 评论 -
数据仓库相关知识
数据仓库(Data Warehouse) 一、概念 数据仓库是这么定义的:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。 这个定义中有一个定义比较容易含混,那就是“面向主题”。面向主题是指数据仓库围绕一些主题,排除对于决策无用的数据,提供特定主体的简明视图。近年提出的“面向专题”的分析和这个概念混淆的厉害,只能用用户熟悉的业务才能作出解释。 面...原创 2018-08-28 17:08:19 · 11179 阅读 · 1 评论