邓超也学大数据 大数据时代,推倒“数据烟囱”何以这么难

原创 2016年05月31日 15:04:39

一直以来,科研数据都被视作生产者的“私产”,尽管越来越多的研究团体发现了数据共享的好处,可以通过开放数据访问和使用的合作,使其学科取得了重大进展,但大范围、海量科研数据的开放共享依然是多年以来一块难以融化的“坚冰”。

  近日,中国科学院为纪念科学数据库建库30周年,正式对外宣布其“十二五”期间建成的科学数据云将面向科技界和企业研发人员免费开放共享。

  提起科学数据云不得不提到中科院科学数据库,作为中科院科学数据库重大工程项目的直接参与和组织管理者,原中科院科学数据库办公室主任李望平从1987年便参与到“中国科学院科学数据库及其信息系统项目”的建设中。

  “与现在社会上其他数据不同的是中科院科学数据库保存的大部分数据都是在长期的科研活动中产生的实验、观测和研究结果等科研数据,是国家的宝贵财富。”李望平告诉记者,科学数据库的建设是属于科学的基础性工作,要通过长期持续的数据积累才能展现出其内在的应用价值。

  多年来,中科院一直在推动科学数据库的共享和应用服务,目的就是让这批宝贵的科学数据资源为社会发挥更大的作用。

  从最初的14家建库单位、21个数据库,发展到“十二五”期间58家单位、1340个数据库,中科院科学数据库整合了从资源学科领域到植物学科领域等多领域数据库资源,提供共享数据量已从2.68GB增加到655TB,年均在线访问超过千万人次。名称也从最初的“中国科学院科学数据库及其信息系统”变成了“科技数据资源整合与共享工程”。

  “现在,中科院科学数据库已经实现由数据积累和软硬件建设向环境构建、工程化项目向持续化发展转变,以云服务模式为基础,形成了支持科研活动与科技创新的数据云,并从基础设施、数据资源、应用平台三大类服务的角度整合集成了各类资源和服务。”作为第四代科学数据库牵头单位和支撑单位主要学科带头人的黎建辉思考更多的是,如何运用迅速发展的信息技术推进中科院乃至我国的科研信息化和科技创新。

  “多年来,我们一直强调科学数据库要面向社会提供应用服务。”李望平透露,中科院科学数据库是最早实现在互联网上提供科学数据查询和数据下载服务的。

  “中科院数据云的开放更多的是一种引领,是一种率先行动,是一种为国家科技创新服务的必然。”在黎建辉看来,国家项目资助的科学工作者有义务通过创造和传播新知识,为公共谋福利,而关联数据是知识的固有成分。能够为已发表科学结论提供证据的数据,应以智能开放的形式同时公开。

  事实上,在开放共享的道路上,中科院一直在行动。以生物信息学分子数据分析环境、地理空间数据云、DViz大数据可视化等应用的推出,创新和发展了多学科领域数据、模型及云服务应用的技术手段与服务模式。

  2015年8月,中科院计算机网络信息中心成功申请并获批我国首批试点网络连续性出版物,创办《中国科学数据》期刊,推动科学数据出版与数据引用,进一步促进我国科学数据资源的开放与共享。

  在服务科研的同时,中科院数据云还面向社会需求不断加强产业化创新服务,提升拓展技术优势。在交通管理、食品安全、新材料研发等公共领域,与国家发改委、食药监总局、北京地税等三十多家企事业单位开展相关合作。

以下是小编根据大家需求整理的大数据培训机构

热烈庆祝尚学堂2016年5月28日线下云计算大数据分享大会圆满结束。

卢菁博士、许伟老师分享了关于推荐系统,大数据多维分析相关技术。我们一直在引领大数据新技术潮流,为云计算大数据技术布道

尚学堂云计算极限班

学习对象:

    本课程适合于有一定编程基础的学员(比如Java,python,c/c++),最好是JavaJava面向对象编程理解J2se里面的io多线程网络编程特别是从事过j2ee开发的程序员,特别适合于大专院校计算机专业的学生

 注:非计算机专业,无任何编程基础,报名参加我们的零基础大数据班。

第一阶段linux+搜索+hadoop体系

  Linux基础→shell编程→高并发架构→hadoop体系→HDFSmapreducehbasezookeeperhivelucene搜索→solr/solrcloudelasticsearch分布式搜索→CM+CDH集群管理→impalaoozieflumesqoop→项目实战一

第二阶段机器学习

  R语言→mahout→项目实战二

第三阶段storm流式计算

  kafkastormredis→项目实战三

第四阶段spark内存计算

  scala编程→spark corespark sqlspark streamingspark mllibspark graphx→项目实战四→python机器学习→spark python编程→项目实战五→项目实战六

第五阶段云计算平台

  dockerkvmopenstack云计算→就业指导

课程会有六大真实企业大型大数据项目,祝你成为大型项目(数据量大,并高发)顶级架构师!

国内首套kylin视频教程:大放送


国内首套tachyon视频教程大放送


链接: http://pan.baidu.com/s/1mh63Jg0密码: im32

线上公开课视频教程:50集-6000分钟精华大放送

免费每日仅限200名观众一起学习  唯一学习网址:https://ke.qq.com/course/93036

小编今天就给大家来来这么多了,以上内容都是自己亲自整理。

扫码加入可以和培训机构老师互动了解最新动态。

QQ群:CSDN推荐群: 523426240

 



相关文章推荐

阿里HBase超详实践总结 | 一文读懂大数据时代的结构化存储

HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构...
  • boonya
  • boonya
  • 2017年07月10日 17:44
  • 258

阿里HBase超详实践总结 | 一文读懂大数据时代的结构化存储

前言 时间回到2011年,Hadoop作为新生事物,在阿里巴巴已经玩得风生水起,上千台规模的”云梯”是当时国内名声显赫的计算平台。 这一年,Hadoop的好兄弟HBase由毕玄大师带入淘宝...

大数据时代

  • 2014年08月22日 05:14
  • 2.41MB
  • 下载

大数据时代

  • 2014年11月23日 18:31
  • 1.88MB
  • 下载

大数据时代创业难:盘点未来十大初创企业

耳常闻“大数据”,眼常看“大数据”,可就是不知如何用“大数据”!对于国内互联网创业者,要是能在这“信息大爆炸”的年头,从海量的“垃圾”信息当中嗅出点端倪,找出个切入点,少不说能成为行业的佼佼者,一不小...
  • mark_qi
  • mark_qi
  • 2013年07月04日 18:22
  • 543

大数据时代的商业建模

  • 2017年10月29日 22:24
  • 52.35MB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:邓超也学大数据 大数据时代,推倒“数据烟囱”何以这么难
举报原因:
原因补充:

(最多只允许输入30个字)