谈谈大数据——Google三大理论

      信计11702班  彭梦洁 
    在没修这门课程之前,对大数据与人工智能只有表面的理解,只是觉得这是一个在计算机领域中是个前沿的东西。在我看来,它跟时尚中的潮流是一样的,可望而不可即。然而接触到了之后觉得这个在生活中处处都有,并不是自己想的那么高大上,比如像淘宝、亚马逊的推送。现拜读了Google三大理论之后,简单谈谈我对这方面的了解吧。
   Google三大理论是Google FS、Map Reduce和Big Table。Map Reduce是基于Google FS产生的,Big Table是建立在其它两个之上的,这三大理论作为三大基础核心技术,构建了完整的分布式运算结构。
   首先,谈谈2003年发布的GFS论文。GFS是一个可扩展的分布式文件系统,使用冗余的方式将被分割成很多块的文件储存于商用机器集群上。在GFS下,每个文件都被分割成固定大小的chunk。GFS由一个master和大量的chunk server构成。为了简化系统结果、提高性能来考虑,设置一个master来保存目录和索引信息,从而产生了单点故障。而为了消除这个单点故障,Google把每个chunk设置的非常大。由于master启动时信息从chunk server中得到,为了保证信息的可靠性,每个chunk都会在不同的chunk server上备份。在此系统中,为避免单个master点失效,允许一个GFS集群中有多个master存在。
    其次,谈谈2004年发布的Map Reduce论文。Map Reduce是一套编程模型和用来处理和产生大规模数据集,由Map和reduce组成,Map把命令分发到多个worker上去,reduce把Map的worker计算出来的结果合并。Map Reduce可以用来处理以TB计算的大量数据集,例如像天气预报、城市外来人口统计等很多现实问题。Map Reduce解决这些问题
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
随着科技的不断发展,大数据应用已经成为了当今社会的热门话题。而在大数据应用中,涉及到的科技伦理问题也越来越受到人们的关注。在这里,我们可以从自然辩证法的角度出发,来谈一谈大数据应用的科技伦理视角。 自然辩证法认为,一切事物都是相互联系、相互作用、相互转化的。在大数据应用中,我们应该看到,大数据不仅仅是一个简单的工具,它背后还涉及到伦理、社会、政治等多个方面的问题。 首先,大数据应用存在的一个显而易见的问题就是隐私保护。在大数据应用中,很多个人的信息都被收集、分析和利用,而这些信息可能会被用于商业或政治目的,甚至可能会被用于侵犯个人隐私。因此,我们需要建立相关的法律法规来保护个人隐私,并对那些侵犯隐私的行为进行惩罚。 其次,大数据应用还涉及到数据的真实性和可靠性问题。在大数据应用中,数据的来源、采集、处理等环节都可能出现错误或造假的情况,这会导致数据的质量受到影响。因此,我们需要加强对大数据的监管,确保数据的真实性和可靠性。 最后,大数据应用也会对社会产生一定的影响。例如,大数据分析可能会导致一些社会群体的歧视和排斥,这是不可接受的。因此,我们需要在大数据应用中注重社会公正和平等,避免对某些人群的歧视和排斥。 总之,大数据应用是一个复杂的问题,需要我们从科技伦理的角度出发,全面考虑其对个人、社会、政治等方面的影响。只有通过加强监管和保护隐私,确保数据的真实性和可靠性,以及关注社会公正和平等,才能推动大数据应用的发展,为社会带来更多的福利。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值