1.1大数据的定义
麦肯锡全球研究所给出大数据(Big Data)的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。即:无法在有限时间内使用常规软件工具对其进行获取、存储、管理和处理的数据集合。
1.2大数据的特点
近年来,”大数据“这个词对人们来说并不陌生。在业界,人们普遍认为大数据具有以下四个特征,其中包括:海量的数据规模(Volume)、快速的数据流转(Velocity)、多样的数据类型(Variety)和价值密度低(Value),简称"4V"。而IBM提出了大数据的"5V"特点,即在原有的基础上增加了数据的准确性和可信赖度(Veracity),即数据的质量。大数据的"5V"特点如下图所示:
图1.大数据5大特点
1.3大数据的应用
大数据的价值关键在于大数据的应用。根据大数据的特点可知,大数据在以下领域有突出的应用,详见图2:
图2.大数据的应用
综上,大数据应用以大数据技术为基础,典型的应用包括,电商领域、金融领域、交通领域、医疗领域等等。
1.4大数据的关键技术
当人们谈到大数据时,往往并非仅指数据本身,而是数据和大数据技术这二者的综合。所谓大数据技术,是指伴随着大数据的采集、传输、处理和应用的相关技术,是一系列使用非传统的工具来对大量的结构化、半结构化和非结构化数据进行处理,从而获得分析和预测结果的一系列数据处理和分析技术。
从大数据的基本处理流程来看——采集、存储、分析和实现。其操作流程大致分为以下5个步骤:
1、数据采集——>2、数据规整——>3、数据存储——>4、数据处理——>5、数据呈现
基于上述,我们将介绍大数据的5大关键技术,其中包括:大数据接入、大数据存储、大数据分析与挖掘、大数据共享交换和大数据展现。具体如图3所示:
图3.大数据5大关键技术
1.5本章小结
本章节主要介绍了大数据的定义,特点,应用和关键技术。通过本章节的学习我们对大数据的概念、特点和相关技术有了一定的了解,其中最重要的是要学习大数据的关键技术,即利用大数据技术去解决实际生活中存在的一些问题。由于大数据存在价值密度低的特点,因此需要我们利用大数据技术不断去挖掘数据中潜藏的价值,让数据更好的服务于人类。