大数据研究背景

随着物联网、社交网络、云计算等技术不断融入我们的生活以及现有的计算能力、存储空间、网络带宽的高速发展,人类积累的数据在互联网、通信、金融、商业、医疗等诸多领域不断地增长和累积[1]。互联网搜索引擎支持的数十亿次web搜索每天处理数万TB字节数据。全世界通信网的主干网上一天就有万TB字节数据在传输[2]。大型商场遍及世界各地的数以千计的门店每周都要处理数亿交易。现代医疗行业如医院、药店等也都每天产生庞大的数据量如医疗记录、病人资料、医疗图像等。数据的量级不断升级、应用的不断深入和大数据不可忽视的价值让我们不得不探索如何才能让我们更好的受益于这些数据。大数据是一次对国家宏观调控、商业战略决策、服务业务和管理方式以及每个人的生活都具有重大影响的一次数据技术革命[3]。大数据的应用与推广将给市场带来千万亿美元收益的机遇,称为数据带来的又一次工业革命[4]。
然而,随着高速发展的信息技术,不断扩张的数据库容量,互联网作为信息传播和再生的平台,“信息泛滥”、“数据爆炸”等现象不绝于耳,海量的数据信息使得人们难以做出快速的抉择。全球互联网发展速度达到每半年就增加一倍,《纽约时报》在20世纪60年代的内容版面十几二十页左右,而如今已达到一百到二百页。国内出版业的《北京青年报》也已出版到四十版。据统计全球人均日阅读时间通常为三十分钟左右,也就说如此大的的数据量仅靠人的阅读来获得有效准确的信息已经难以为继。信息冗余、信息真假、信息安全、信息处理、信息统一等问题也随着大数据给人们带来价值的同时也造成了一系列的问题。人们不仅希望能够从大数据中提取出有价值的信息,更希望发现能够有效支持生产生活中需要决策的更深层次的规律。
在现实情况的背景下,人们意识到如何有效地解决海量数据的利用问题具有研究价值和经济利益。但是面对如此海量的数据并且维度高、数据结构复杂,如何能够有效的从中挖掘出数据价值是人们需要面对的问题。面向大数据的数据挖掘研究就显得十分重要。面向大数据的数据挖掘的特有两个最重要的任务。一是实时性,如此海量的数据规模需要实时分析并迅速反馈结果。二是准确性ÿ

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值