企业的大数据战略 - 电子书下载(高清版PDF格式+EPUB格式)


企业的大数据战略-[荷] 马克·冯·里吉门纳姆(Mark van Rijmenam)

            在线阅读                   百度网盘下载(7mxt)


image.png

书名:企业的大数据战略

作者:[荷] 马克·冯·里吉门纳姆(Mark van Rijmenam)

格式:EPUB, HTMLZ, PDF

路径:点击打开

排序作者:Rijmenam), 马克·冯·里吉门纳姆(Mark van

排序书名:企业的大数据战略

日期:08 12月 2018

uuid:a9365572-0d1b-42d8-8d6c-78e9a6fb2c4b

id:474

出版日期:3月 2018

修改日期:08 12月 2018

大小:7.46MB

语言:中文


语义网(The Semantic Web),又称为Web 3.0,通常是指互联网的下一个发展阶段。当前,互联网充斥着庞杂的非结构化或者半结构化数据,在万维网联盟(World Wide Web Consortium,简称W3C)的引领下,语义网雄心勃勃,力求把所有的非结构和半结构化数据进行归类,构建一个“数据网络”。万维网联盟称,语义网可以突破不同应用程序、社群和企业的边界,实现更为便利的数据共享和再利用。

蒂姆·伯纳斯-李(Tim Bermers-Lee)是互联网的创始人,早在1998年,他就在一份白皮书中对语义网进行了如下定义:“语义网是数据网络,从某种程度上讲,堪称全球数据库。”这个数据库包含了目前所有的非结构化数据、半结构化数据以及结构化数据,只是这些数据还处于竖井中,尚未发挥作用。在该白皮书中,伯纳斯-李还阐述了语义网发展的基本原理,他写道:“作为一个信息空间,语义网的宗旨不仅是促进人际沟通,还希望能让机器参与其中,为人际沟通提供辅助作用。要实现机器辅助人际沟通,有一个最大的阻碍,就是互联网的大部分信息是基于人类使用而设计的,即便有些信息是源于每个分类精准定义的数据库,但是这些数据库中的数据结构依然不适用于机器浏览网页。”

语义网将实现全人类与连网设备的相互交流,在不同的应用程序和企业内实现数据的实时共享和不同形式的再利用。毋庸置疑,这与大数据息息相关。

在第1章中,我们阐述了大数据的“7V”特征,即高速度、多样性、大体量、真实性、可变性、可视化和高价值。高速度是指数据诞生的速度之快;多样性是指数据形式繁多;大体量是指数据总量巨大;真实性是指数据精确无误;可变性是指随着时间的推移,数据意义会发生改变;可视化是指让数据以简单易懂的方式呈现;高价值是指数据可以为企业和社会创造巨大的经济效益。

“7V”特征不仅对大数据进行了定性,也揭示了语义网面临的挑战和大数据的未来:互联网上的数据以诞生速度快、体量大、形式多样、变化迅速而著称,那么我们该如何在确保这些数据准确、优质和易懂的情况下,实现这些数据的互联和为人们所用呢?此外,“7V”特征也揭示了大数据在语义网的创建过程中所起的重要作用。现阶段,只要是用于拓展大数据的技术,例如Hadoop、开源工具以及初创公司研发出的技术,都有利于语义网的发展。同时,大数据和语义网的发展需要以更低廉的成本实现更好的数据处理、数据连接以及数据分析。

拉马尼·潘杜罗甘(Ramani Panduranga)是XO Communication网络工程部门的副总裁,他在博客上对语义网做了如下阐述:“从根本上讲,语义网作为连接数据(这些数据储藏在语义网上的不同数据库中)的元数据的框架,可以实现机器查询数据库,并生成更有用的结果。”当还处于竖井中的数据库实现了相互连接,机器就可以搜索和连接这些数据库中的数据,并与这些数据进行交流。

正如蒂姆·伯纳斯-李在1998年所说的,语义网更侧重于机器与网络的连接交流。现在,我们将这种机器与网络的连接交流称为物联网。要连接250亿~500亿个不同的设备,并实现这些设备的共同操作,前提条件是这些设备可以做到像人一样浏览和连接网络,并与网络交流。十多年后,当数万亿个传感器与网络实现实时连接,共同操作的重要性就会更加凸显。

因此,大数据相关技术一方面让语义网日臻完善,另一方面也要求语义网能精准运行,并充分挖掘大数据的潜能。只有语义网运行良好,才能开启大数据光明的未来。

詹森·霍夫曼(Jason Hoffman)是Joyent的首席技术官,他预测,未来大数据的关键在于把数据、计算和网络三者相结合。个人电脑是计算和网络相结合的典型代表,而计算与数据的结合可以实现对艾字节的原始数据进行分析,进而实现在大型数据库中随意提问。

未来的大数据可以让我们通过口头提问,轻轻松松找到答案。现在,用户还必须知道他们想要知道什么,而在未来,这都大可不必。

当我们不再需要通过提问获取答案,而是即便不知道问题,也能得到答案,大数据就取得了真正的进展。先进的搜索模式和模式分类,可以通过算法为企业提供决策。各式各样美观的可视化会变得越发重要,且有利于企业理解波字节的数据。

迈入波字节时代

未来几十年,大数据科学家将成为大家争相追逐的对象,但是大数据时代真正的大赢家是那些让大数据简单易懂、易于操作,而让大数据科学家毫无用武之地的企业。大企业有能力聘用大数据科学家,而中小企业使用大数据的市场更大,却无力承担聘请大数据科学家的费用。初创公司只要能够让中小企业无须借助大数据科学家而独立使用大数据,就会极具竞争力。

大数据初创公司开发的算法会更加智能,智能手机也会跟上步伐,而人人口袋里将会有一台超级电脑,能够对复杂程度超乎想象的计算任务进行实时处理和运算,并且你能在这个超级电脑的巴掌大的屏幕上看到整个运算过程。随着物联网、工业互联网和数万亿传感器的出现,待处理的数据总量将会以指数级的速度激增。

大数据只会有增无减,而波字节也会成为会议上频繁提及的词语。幸运的是,数据储存可以为更多人所用,而且价格会更加亲民。随处可见的波字节会让“大数据”这一术语慢慢淡出历史舞台,届时,大数据将仅仅是普通数据而已。

然而,在此之前,数据还是处于不断增长的阶段,而企业和政府正在处理这些不断增长的数据,这势必造成隐私问题。那些遵守了道德准则的企业会继续存活,而触碰了用户隐私的企业将会被淘汰出局,因为保护隐私是一种自律行为。然而,因为普通老百姓随时都在与大数据打交道,所以政府必须出力保护用户隐私。公众会不可避免地对大数据给用户隐私带来的不利影响产生质疑。总之,我们不要上演电影《少数派报告2》(Minority Report 2.0)中的桥段。

我们还未真正迎来大数据时代,一切还都是未知,然而,可以肯定的是,未来的变化必将改变众多企业和社会本身。大数据的发展必然将持续下去,所以企业必须灵活应变。如果企业不及时采用大数据策略,暂时可能还无碍大局,但是显然,那些已经采用大数据策略的企业正在赶超同行,成为行业翘楚。因此,如果你希望你的企业能够赶上大数据时代的潮流,能够在大数据时代为用户提供大数据相关的产品和服务,采用大数据策略刻不容缓。祝你好运。

来源:我是码农,转载请保留出处和链接!

本文链接:http://www.54manong.com/?id=1158

'); (window.slotbydup = window.slotbydup || []).push({ id: "u3646208", container: s }); })();
'); (window.slotbydup = window.slotbydup || []).push({ id: "u3646147", container: s }); })();
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
⼤数据概述 ⼤数据概述 什么是⼤数据? ⼤数据(big data)是指⽆法在⼀定时间范围内⽤常规软件⼯具进⾏捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策⼒、洞 察发现⼒和流程优化能⼒的海量、⾼增长率和多样化的信息资产。 ------百度百科 ⼀,⼤数据时代: 1)第⼀次信息化浪潮使计算机开始普及,第⼆次信息化浪潮⼈类全⾯进⼊互联⽹时代,第三次信息化浪潮解决了信息爆炸问题,⼤数据时代来。 2)存储设备容量不断增加,cpu处理能⼒⼤幅度提升,⽹络带宽不断增加为⼤数据时代提供技术⽀持。 3)数据产⽣⽅式从1.运营式阶段>2.⽤户原创内容阶段>3.感知式阶段 的变⾰促成了⼤数据时代的到来。 4)⼤数据发展阶段:   1.萌芽阶段:20世纪90年代⾄21世纪初,随着数据挖掘理论和数据库技术的逐步成熟,⼀批商业智能⼯具和知识管理技术开始被应⽤,如数据 仓库、专家系统、知识管理系统等   2.成熟阶段:21世纪前10年,web2.0应⽤发展,⾮结构化数据⼤量产⽣,传统处理⽅法难以应对,带动了⼤数据技术的快速突破,⼤数据解 决⽅案逐渐⾛向成熟,形成了并⾏计算与分布式系统两⼤核⼼技术,⾕歌的GFS和MapReduce等⼤数据技术受到追捧,Hadoop平台开始⼤⾏其 道。   3.⼤规模应⽤期:2010年以后,⼤数据应⽤渗透各⾏业,数据驱动决策,信息社会智能化程度⼤幅度提⾼ ⼆,⼤数据概念:"4个V" 1)数据量⼤(volume) 2)数据类型繁多(variety) 3)处理速度快(velocity) 4)价值密度低(value) 三,⼤数据影响: 1)⼤数据对科学研究的影响:   1.实验科学>2.理论科学>3.计算科学>4.数据密集型科学 2)⼤数据对思维⽅式的影响:   1.全样⽽⾮抽样   2.效率⽽⾮精确   3.相关⽽⾮因果 3)⼤数据对社会发展的影响:   1.⼤数据决策成为⼀种新的决策⽅式   2.⼤数据应⽤促进信息技术与各⾏业的深度融合   3.⼤数据开发推动新技术和新应⽤的不断涌现 四,⼤数据的应⽤:   ⼤数据⽆处不在,包括⾦融、汽车、餐饮、电信、能源、体育和娱乐等在内的社会各⾏各业都已经融⼊了⼤数据的印记 五,⼤数据关键技术: 技术层 ⾯ 功能 数据采 集与预 处理 利⽤ETL⼯具将分布的、异构数据源中的数据,如关系数据,平⾯数据⽂件等,抽取到临时中间层后进⾏清洗、转换、集成,最后加载 到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础;也可以利⽤⽇志采集⼯具(如Flume、kafka等)把实时采集的数据作 为流计算系统的输⼊,进⾏实时处理分析  数据存 储和管 理 利⽤分布式⽂件系统、数据仓库、关系数据库、nosql数据库、云数据库等,实现对结构化、半结构化和⾮结构化和⾮结构化海量数据的 存储和管理 数据处 理与分 利⽤分布式并⾏编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析;对分析结果进⾏可视化呈现,帮 助⼈们更好地理解数据、分析数据 析 数据安 全和隐 私保护 在从⼤数据中挖掘潜在的巨⼤商业价值和学术价值的同时,构建隐私数据保护体系和数据安全体系,有效保护个⼈隐私和数据安全 六,⼤数据计算模式: ⼤数据计算 模式 解决问题 代表产品 批处理计算 针对⼤规模数据的批量处理 MapReduce、Spark等 流计算 针对流数据的实时计算 Storm、S4、Flume、Streams、Puma、DStream、SuperMario、银河流 数据处理平台等 图计算 针对⼤规模图结构数据的处 理 Pregel、GraphX、Giraph、PowerGraph、Hama、GoldenOrb等 查询分析计 算 ⼤规模数据的存储管理和查 询分析 Dremel、Hive、Cassandra、Impala等 七,⼤数据产业:   ⼤数据产业是指⼀切与⽀撑⼤数据组织管理和价值发现相关的企业经济活动的集合。   ⼤数据产业包括IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层和数据应⽤层。 ⼋,⼤数据与云计算、物联⽹: ⼀)云计算: 1)云计算概念:云计算实现了通过⽹络提供可伸缩的、廉价的分布式计算能⼒,⽤户只需要在具备⽹络接⼊条件的地⽅,就可以随时随地地获得 所需的各种IT资源 2)元计算的关键技术:虚拟化、分布式存储、分布式计算、多租户等。 3)云计算数据中⼼:是⼀整套复杂的设施,包括⼑⽚服务器、宽带⽹络连接、环境控制设备、监控设备⼀级耕种安全装置等。数据中⼼是云计算 的重要载体,为云计算提供计算、存储、宽带等各种硬件资源,为各种平台和应⽤提供运⾏⽀撑环境。 4)云计算的应⽤:在电⼦政务、医疗、卫⽣、教育、企业等领域的应⽤不断深化,对提⾼政府服务⽔平促进产业转型升级和培育发展

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值