大数据触发大竞技

 分布式计算(Hadoop)和大数据(Big Data)技术的一个重要应用是分析用户的社交行为,有些时候它们会在用户毫不知情的情况下进行分析。
 

  大数据通常指大量不断增长的数据,包括Facebook和Twitter网站上的非结构化数据,以及从这些数据中收集信息创造商业机会的方法。然而,这一概念对于那些在互联网上展示自己生活的人来说具有风险,同时也带来了一个疑问,即到底谁该拥有这些数据?

对大数据以及人工智能概念都是模糊不清的,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:458345782,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系 。从java和linux入手,其后逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相关知识一一分享!

 

大数据触发大竞技

  大数据与Apache的Hadoop分布式计算平台等技术相关联,同时促使包括IBM在内的一些技术公司展开重量级收购。不过,GigaOm的分析师Derrick Harris指出,“大数据”的定义存在一些问题。他认为,大数据实际上是指来自不同来源的数据,包括社交网络甚至手机等来源。他说:“这些数据正源源不断地来自传感器、计算机和Web。”
 

  Harris指出,IT和业务部门对大数据的强烈兴趣在于,能够驾驭这些数据,实际上就是能够分析这些数据。Mozilla的开发人员Christian Heilmann称,关于大数据,好消息是我们积累了大量的信息,我们拥有可利用这些数据的系统。例如,分析人类基因组信息或者提供政府数据等。通过租用一个小时的服务器使用Hadoop等技术,商业分析能够研究这些大型的数据集。
 

  由于厂商对此越来越重视,那么他们开始采取行动以利用大数据就不足为奇了。Harris指出,IBM最近用17亿美元收购了提供数据仓库设备的Netezza公司。同时,Teradata将收购提供非结构化数据高级分析和管理的数据仓库厂商Aster Data。
 

大数据所有权之争

  Heilmann把大数据看作是从网络上收集的任何信息,任何实时的数据。但是,谁具体拥有这个数据呢?他说:“这个问题存在很大的争议。”
 

  “我认为Facebook等网站让用户提供他们自己的信息,却不让用户知道他们正在收集分析这些数据的行为是是很危险的。”Heilmann说。例如,用户可以上载自己喝醉的照片,而他潜在的雇主至少在此后某一时间可以浏览这个照片。Heilmann强调:“你从互联网上删除任何东西都是非常困难的。只要你把它放到网络上,它就被存储起来了。它将被复制到其他地方。你应该对于你放在网络上的东西非常慎重。”
 

  Harris认为,这个数据的所有权取决于环境。他说:“当然是生成这个数据的公司拥有这个数据。”他指出,虽然在网络上有公共所有的数据,但是Facebook和Twitter拥有他们的用户生成的数据。例如,数据市场等大型数据概念已经导致一些公司一次用1个月时间分析Twitter的数据流。
 

  Cloudera的CTO Awadallah认为,谁拥有非结构化数据这一问题是很难回答的。他举例称,例如苹果应用商店里的客户采购信息就属于苹果公司,虽然谷歌向用户提供删除数据的权利,但是这些数据的所有权属于谷歌。
 

  相反,迁移社交网络数据的数据携带计划(Data Portability Project)则认为,用户拥有他们自己的数据,社交网络应该让用户方便地把自己的数据带到其他地方。该计划的共同发起人、Echo公司负责战略的副总裁Chris Saad表示,这一努力的目标是,让网站披露当用户把数据上载到网络之后,用户能够对自己的数据做些什么。
 

  Saad同时指出,在一些案例中,用户同他们使用的在线服务共享自己数据的所有权和监护权。他说:“这就像把钱放在银行一样。虽然你拥有那些钱,但是你基本上是让银行为你保管,并可能代表你使用这些钱。”
 

  这个问题不仅仅是隐私问题。“大数据”的定义之一就是,从多个来源中分析数据,以便找出趋势、商业机会、市场变化、潜在的客户、客户情感等许多事情。当大数据工具分析网络上的信息的时候,他们真的有权在未经拥有者许可的情况下这样做吗?
 

  对此,Saad说:“这实际上取决于具体情况。如果你在公共互联网上发表这些信息,那么我认为社会规则就是人们期待着自己的数据被提取、分析、索引和使用。另一方面,当Facebook被视为一个私有网络,并且让你选择哪些信息可以公开时,这就有区别了,公开这些信息就违反了社会规则。”

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值