邓超也学大数据 大数据时代,推倒“数据烟囱”何以这么难

原创 2016年05月31日 15:04:39

一直以来,科研数据都被视作生产者的“私产”,尽管越来越多的研究团体发现了数据共享的好处,可以通过开放数据访问和使用的合作,使其学科取得了重大进展,但大范围、海量科研数据的开放共享依然是多年以来一块难以融化的“坚冰”。

  近日,中国科学院为纪念科学数据库建库30周年,正式对外宣布其“十二五”期间建成的科学数据云将面向科技界和企业研发人员免费开放共享。

  提起科学数据云不得不提到中科院科学数据库,作为中科院科学数据库重大工程项目的直接参与和组织管理者,原中科院科学数据库办公室主任李望平从1987年便参与到“中国科学院科学数据库及其信息系统项目”的建设中。

  “与现在社会上其他数据不同的是中科院科学数据库保存的大部分数据都是在长期的科研活动中产生的实验、观测和研究结果等科研数据,是国家的宝贵财富。”李望平告诉记者,科学数据库的建设是属于科学的基础性工作,要通过长期持续的数据积累才能展现出其内在的应用价值。

  多年来,中科院一直在推动科学数据库的共享和应用服务,目的就是让这批宝贵的科学数据资源为社会发挥更大的作用。

  从最初的14家建库单位、21个数据库,发展到“十二五”期间58家单位、1340个数据库,中科院科学数据库整合了从资源学科领域到植物学科领域等多领域数据库资源,提供共享数据量已从2.68GB增加到655TB,年均在线访问超过千万人次。名称也从最初的“中国科学院科学数据库及其信息系统”变成了“科技数据资源整合与共享工程”。

  “现在,中科院科学数据库已经实现由数据积累和软硬件建设向环境构建、工程化项目向持续化发展转变,以云服务模式为基础,形成了支持科研活动与科技创新的数据云,并从基础设施、数据资源、应用平台三大类服务的角度整合集成了各类资源和服务。”作为第四代科学数据库牵头单位和支撑单位主要学科带头人的黎建辉思考更多的是,如何运用迅速发展的信息技术推进中科院乃至我国的科研信息化和科技创新。

  “多年来,我们一直强调科学数据库要面向社会提供应用服务。”李望平透露,中科院科学数据库是最早实现在互联网上提供科学数据查询和数据下载服务的。

  “中科院数据云的开放更多的是一种引领,是一种率先行动,是一种为国家科技创新服务的必然。”在黎建辉看来,国家项目资助的科学工作者有义务通过创造和传播新知识,为公共谋福利,而关联数据是知识的固有成分。能够为已发表科学结论提供证据的数据,应以智能开放的形式同时公开。

  事实上,在开放共享的道路上,中科院一直在行动。以生物信息学分子数据分析环境、地理空间数据云、DViz大数据可视化等应用的推出,创新和发展了多学科领域数据、模型及云服务应用的技术手段与服务模式。

  2015年8月,中科院计算机网络信息中心成功申请并获批我国首批试点网络连续性出版物,创办《中国科学数据》期刊,推动科学数据出版与数据引用,进一步促进我国科学数据资源的开放与共享。

  在服务科研的同时,中科院数据云还面向社会需求不断加强产业化创新服务,提升拓展技术优势。在交通管理、食品安全、新材料研发等公共领域,与国家发改委、食药监总局、北京地税等三十多家企事业单位开展相关合作。

以下是小编根据大家需求整理的大数据培训机构

热烈庆祝尚学堂2016年5月28日线下云计算大数据分享大会圆满结束。

卢菁博士、许伟老师分享了关于推荐系统,大数据多维分析相关技术。我们一直在引领大数据新技术潮流,为云计算大数据技术布道

尚学堂云计算极限班

学习对象:

    本课程适合于有一定编程基础的学员(比如Java,python,c/c++),最好是JavaJava面向对象编程理解J2se里面的io多线程网络编程特别是从事过j2ee开发的程序员,特别适合于大专院校计算机专业的学生

 注:非计算机专业,无任何编程基础,报名参加我们的零基础大数据班。

第一阶段linux+搜索+hadoop体系

  Linux基础→shell编程→高并发架构→hadoop体系→HDFSmapreducehbasezookeeperhivelucene搜索→solr/solrcloudelasticsearch分布式搜索→CM+CDH集群管理→impalaoozieflumesqoop→项目实战一

第二阶段机器学习

  R语言→mahout→项目实战二

第三阶段storm流式计算

  kafkastormredis→项目实战三

第四阶段spark内存计算

  scala编程→spark corespark sqlspark streamingspark mllibspark graphx→项目实战四→python机器学习→spark python编程→项目实战五→项目实战六

第五阶段云计算平台

  dockerkvmopenstack云计算→就业指导

课程会有六大真实企业大型大数据项目,祝你成为大型项目(数据量大,并高发)顶级架构师!

国内首套kylin视频教程:大放送


国内首套tachyon视频教程大放送


链接: http://pan.baidu.com/s/1mh63Jg0密码: im32

线上公开课视频教程:50集-6000分钟精华大放送

免费每日仅限200名观众一起学习  唯一学习网址:https://ke.qq.com/course/93036

小编今天就给大家来来这么多了,以上内容都是自己亲自整理。

扫码加入可以和培训机构老师互动了解最新动态。

QQ群:CSDN推荐群: 523426240

 



大数据为什么这么“火”? 为什么那么多人转型学大数据??

近几年,大数据这个词突然变得很火,不仅纳入阿里巴巴、谷歌等互联网公司的战略规划中,同时也在我国国务院和其他国家的政府报告中多次提及,大数据无疑成为当今互联网世界中的新宠儿。今天我就给大家分析一下大数据...
  • mountain623
  • mountain623
  • 2016年11月29日 13:27
  • 450

《大数据时代(BIG DATA)》

—-豆瓣链接—- 大数据的时代思维变革 不是随机样本,而是全体数据 小数据时代的随机采样,最少的数据获得最多的信息 采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加...
  • my_precious
  • my_precious
  • 2016年10月12日 09:56
  • 1366

大数据时代的变革与顺势而为——读《大数据时代》

欢迎大家关注我的微信公众号,微信搜索“东冬咚”或者“haidongzhisheng”,更多精彩内容尽请期待! 今天,大数据是目前炒得比较火的一个话题。今天给大家介绍一部书,《大数据时代》,浙江出版社...
  • dongdong9223
  • dongdong9223
  • 2016年08月19日 18:28
  • 1790

学习编程有那么难吗?

英语不好,上学时考试从来没有超过40分。 数学也不行,好多的东西都还给老师了。 我还能学习编程吗??? 刚开始学习做游戏的时候,这个问题深深的困扰着我。以至于我当时报培训班之前犹豫了很长很长时间...
  • wangningdong
  • wangningdong
  • 2014年10月31日 22:07
  • 713

蔡莉-大数据时代下的数据质量挑战及数据质量评估

蔡莉-大数据时代下的数据质量挑战及数据质量评估 数据质量是分析和利用大数据的前提,是获取大数据价值的重要保障。目前,国内外尚缺乏针对大数据质量维度和质量评估方法的全面分析和研究。基于此,本报...
  • chengying332
  • chengying332
  • 2014年05月22日 09:24
  • 892

大数据时代下的企业管理创新

从企业的角度来说,我们是在倾听数据发出来的声音,尊重数据有如尊重人才,数据将成为企业最重要的资产,企业价值与其拥有的数据规模、活性以及其解释、运用数据的能力成正比,企业数据资产将在未来演绎着精彩的商业...
  • harrymeng
  • harrymeng
  • 2014年10月19日 07:47
  • 5491

大数据时代:正在到来的数据革命

利用一周的时间终于拜读完涂子沛的大数据,这本书在国内政界和商界都引起强烈的反响,的确引人深思,也那怪科技圈内人士首推这本书,因为当前社会正如马云所说那样我们已经已经从IT时代过渡到DT时代了,我们即将...
  • u013360881
  • u013360881
  • 2015年12月19日 10:07
  • 2017

各种界面技术比较

前言纵观这几年,界面库的发展可谓风声水起,讽刺意味的是:大家对PC上的界面重视程度,来源于手机界面的发展。当苹果出现时,彻底让人们对界面的需求,提高了一个台阶。随之而来的是粗糙界面的塞班界面的没落。过...
  • CometNet
  • CometNet
  • 2014年07月24日 10:39
  • 12303

大数据时代的4个V

“大数据”的经典定义是可以归纳为4个V:海量的数据规模(volume)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)和巨大的数据价值(value)。   ...
  • u013887254
  • u013887254
  • 2014年12月15日 10:46
  • 1624

大数据时代的伦理道德

一.问题体现 数据采集的伦理问题: 以往的数据采集皆由人工进行,被采集人一般都会被告知,而如今的大数据时代,数据采集都被智能设备自动采集,而且被采集对象往往并不知情。例如我们每天上网所产...
  • zjw819703057
  • zjw819703057
  • 2017年12月11日 17:33
  • 208
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:邓超也学大数据 大数据时代,推倒“数据烟囱”何以这么难
举报原因:
原因补充:

(最多只允许输入30个字)