1.大数据有四个主要特征:\n1.Volume:数据量巨大\n体量大是大数据区分于传统数据最显著的特征。一般关系型数据库处理的数据量在TB级,大数据所处理的数据量通常在PB级以上。\n\n2.Variety:数据类型多\n大数据所处理的计算机数据类型早已不是单一的文本形式或者结构化数据库中的表,它包括订单、日志、BLOG、微博、音频、视频等各种复杂结构的数据。\n\n3.Velocity:数据流动快\n速度是大数据区分于传统数据的重要特征。在海量数据面前,需要实时分析获取需要的信息,处理数据的效率就是组织的生命。\n\n4.Value:数据潜在价值大\n在研究和技术开发领域,上述三个特征已经足够表征大数据的特点。但在商业应用领域,第四个特征就显得非常关键!投入如此巨大的研究和技术开发的努力,就是因为大家\n都洞察到了大数据的潜在巨大价值。如何通过强大的机器学习和高级分析更迅速地完成数据的价值“提纯”,挖掘出大数据的潜在价值,这是目前大数据应用背景下苛待解决的难题。http://blog.itpub.net/15498/viewspace-1875639/
2.结构化数据:即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。\n\n \n\n\n
非结构化数据:不方便用数据库二维逻 辑表来表现的数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。
转载:https://www.cnblogs.com/ljianhui/archive/2012/07/27/2695910.html
3. Hadoop生态圈:Hadoop是目前应用最为广泛的分布式大数据处理框架,其具备可靠性、高效性、可伸缩性等特点。\nHadoop的核心组件是HDFS、MapReduce。随着处理的任务不同,各种组件的相继出现,有着丰富的Hadoop生态圈。