大数据=大数据+大数据技术+大数据应用
大数据来源:结构化和非结构化数据。企业+个人+政府数据。
大数据技术:指对大规模数据的收集、分析、挖掘和应用的技术。工具一般包括hadoop,spark,storm等,即hdfs,mapreduce,hbase,hive,pig等。数据的采集是指通过某种方法或手段收集各种产生数据。目的是分析,挖掘数据的规律和潜在价值,为决策提供依或者直接用到相应的产品和服务中。数据价值体现在于对其进行的应用。
大数据具体应用工具:一般包括hadoop,spark,storm等,即hdfs,mapreduce,hbase,hive,pig等。
与云计算关系:云计算类似于操作系统,大数据技术类似于处理对象。云计算将所以单机系统虚拟化,形成一个整体。大数据技术就是将计算和存储任务分配到不同计算机上。核心是分布式计算和分布式存储。
大数据应用:银行业,各个行业。