Security and Privacy in Big Data Lifetime A Review
Abstract
由于诸如物联网(IoT),云计算,互联网服务和社交网络等新兴信息技术的快速增长,引起了人们对大数据安全性和隐私性的日益增长的兴趣。大数据的整个生命周期包含四个阶段:大数据收集;传输,处理和分析;存储和管理。但是,大数据的五个显着特征:数量,多样性,速度,价值和准确性对在其整个生命周期中保护大数据的安全性和隐私提出了巨大的挑战。在本文中,我们调查了用于确保大数据安全性和隐私性的方案和技术。基于文献综述,我们讨论了该研究领域在大数据生命周期中全面保护大数据安全和隐私方面的挑战和问题。
Introduction
大数据为我们带来了很大的机会,可以通过进一步的处理和分析来学习新的和潜在的信息。它在医疗,教育,金融和政府等不同领域中越来越多地生产和使用。企业在大数据分析的基础上,学习可以提高业务决策正确性并实现业务智能的知识。可以基于大数据挖掘为用户提供智能服务。大数据不仅为人们的日常生活带来便利,还为企业带来机遇。
如果数据在其生命周期内不能得到很好的保护,则很容易泄露用户隐私,其中包括四个阶段:数据收集,数据传输,数据处理和分析以及数据存储和管理。因此,如果我们想享受大数据带来的便利和好处,确保其安全性和隐私性就成为一项必不可少的任务。
Overview of Big Data
Definition and Features of Big Data
Entire Lifetime of Big Data
大数据收集(CLC),传输(TSM),处理和分析(PA)以及大数据存储和管理(SM)
数据采集。还可以从物联网中的大量传感器收集数据。庞大而混乱的数据收集与准确的数据处理和分析高度相关,这使我们能够从中获取有价值的信息。许多互联网公司都有自己的海量数据收集工具,例如Hadoop中的Chukwa,Cloudera中的Flume和Facebook中的Scribe。对于高度机密的公司或研究机构中的生产和运营数据,可以使用特定的系统接口进行数据收集。
数据传输。数据传输在数据交换和传播中起着重要作用。通常需要将物联网和人类使用的移动设备中的大量传感器收集的数据传输到电源服务器(例如,在云中)以存储,处理和管理,数据传输变得至关重要。数据传输有助于各方之间的数据交换,支持数据聚合和融合以及数据挖掘和分析。
数据处理和分析。大数据处理和分析是指对大数据进行预处理和分析,以获取无噪声,有价值和有意义的数据,并使用特定技术学习有价值的信息。在数据处理过程中,通常会使用诸如数据挖掘,机器学习和语言学习之类的技术。为了获得大数据的价值,处理和分析阶段对于大数据生命周期至关重要。在此阶段,用户可以获得期望的有价值的数据,而不是将有用和无用的信息混合在一起的所有数据。
数据存储和管理。随着互联网和云计算的发展,传统的数据存储和管理系统已经崩溃。在大数据时代,大数据存储和管理的主要技术有:分布式文件系统,分布式数据库,访问接口和查询语言等。