邓超也学大数据 大数据时代,推倒“数据烟囱”何以这么难

原创 2016年05月31日 15:04:39

一直以来,科研数据都被视作生产者的“私产”,尽管越来越多的研究团体发现了数据共享的好处,可以通过开放数据访问和使用的合作,使其学科取得了重大进展,但大范围、海量科研数据的开放共享依然是多年以来一块难以融化的“坚冰”。

  近日,中国科学院为纪念科学数据库建库30周年,正式对外宣布其“十二五”期间建成的科学数据云将面向科技界和企业研发人员免费开放共享。

  提起科学数据云不得不提到中科院科学数据库,作为中科院科学数据库重大工程项目的直接参与和组织管理者,原中科院科学数据库办公室主任李望平从1987年便参与到“中国科学院科学数据库及其信息系统项目”的建设中。

  “与现在社会上其他数据不同的是中科院科学数据库保存的大部分数据都是在长期的科研活动中产生的实验、观测和研究结果等科研数据,是国家的宝贵财富。”李望平告诉记者,科学数据库的建设是属于科学的基础性工作,要通过长期持续的数据积累才能展现出其内在的应用价值。

  多年来,中科院一直在推动科学数据库的共享和应用服务,目的就是让这批宝贵的科学数据资源为社会发挥更大的作用。

  从最初的14家建库单位、21个数据库,发展到“十二五”期间58家单位、1340个数据库,中科院科学数据库整合了从资源学科领域到植物学科领域等多领域数据库资源,提供共享数据量已从2.68GB增加到655TB,年均在线访问超过千万人次。名称也从最初的“中国科学院科学数据库及其信息系统”变成了“科技数据资源整合与共享工程”。

  “现在,中科院科学数据库已经实现由数据积累和软硬件建设向环境构建、工程化项目向持续化发展转变,以云服务模式为基础,形成了支持科研活动与科技创新的数据云,并从基础设施、数据资源、应用平台三大类服务的角度整合集成了各类资源和服务。”作为第四代科学数据库牵头单位和支撑单位主要学科带头人的黎建辉思考更多的是,如何运用迅速发展的信息技术推进中科院乃至我国的科研信息化和科技创新。

  “多年来,我们一直强调科学数据库要面向社会提供应用服务。”李望平透露,中科院科学数据库是最早实现在互联网上提供科学数据查询和数据下载服务的。

  “中科院数据云的开放更多的是一种引领,是一种率先行动,是一种为国家科技创新服务的必然。”在黎建辉看来,国家项目资助的科学工作者有义务通过创造和传播新知识,为公共谋福利,而关联数据是知识的固有成分。能够为已发表科学结论提供证据的数据,应以智能开放的形式同时公开。

  事实上,在开放共享的道路上,中科院一直在行动。以生物信息学分子数据分析环境、地理空间数据云、DViz大数据可视化等应用的推出,创新和发展了多学科领域数据、模型及云服务应用的技术手段与服务模式。

  2015年8月,中科院计算机网络信息中心成功申请并获批我国首批试点网络连续性出版物,创办《中国科学数据》期刊,推动科学数据出版与数据引用,进一步促进我国科学数据资源的开放与共享。

  在服务科研的同时,中科院数据云还面向社会需求不断加强产业化创新服务,提升拓展技术优势。在交通管理、食品安全、新材料研发等公共领域,与国家发改委、食药监总局、北京地税等三十多家企事业单位开展相关合作。

以下是小编根据大家需求整理的大数据培训机构

热烈庆祝尚学堂2016年5月28日线下云计算大数据分享大会圆满结束。

卢菁博士、许伟老师分享了关于推荐系统,大数据多维分析相关技术。我们一直在引领大数据新技术潮流,为云计算大数据技术布道

尚学堂云计算极限班

学习对象:

    本课程适合于有一定编程基础的学员(比如Java,python,c/c++),最好是JavaJava面向对象编程理解J2se里面的io多线程网络编程特别是从事过j2ee开发的程序员,特别适合于大专院校计算机专业的学生

 注:非计算机专业,无任何编程基础,报名参加我们的零基础大数据班。

第一阶段linux+搜索+hadoop体系

  Linux基础→shell编程→高并发架构→hadoop体系→HDFSmapreducehbasezookeeperhivelucene搜索→solr/solrcloudelasticsearch分布式搜索→CM+CDH集群管理→impalaoozieflumesqoop→项目实战一

第二阶段机器学习

  R语言→mahout→项目实战二

第三阶段storm流式计算

  kafkastormredis→项目实战三

第四阶段spark内存计算

  scala编程→spark corespark sqlspark streamingspark mllibspark graphx→项目实战四→python机器学习→spark python编程→项目实战五→项目实战六

第五阶段云计算平台

  dockerkvmopenstack云计算→就业指导

课程会有六大真实企业大型大数据项目,祝你成为大型项目(数据量大,并高发)顶级架构师!

国内首套kylin视频教程:大放送


国内首套tachyon视频教程大放送


链接: http://pan.baidu.com/s/1mh63Jg0密码: im32

线上公开课视频教程:50集-6000分钟精华大放送

免费每日仅限200名观众一起学习  唯一学习网址:https://ke.qq.com/course/93036

小编今天就给大家来来这么多了,以上内容都是自己亲自整理。

扫码加入可以和培训机构老师互动了解最新动态。

QQ群:CSDN推荐群: 523426240

 



版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

超清大数据时代

  • 2014-06-17 18:10
  • 2.29MB
  • 下载

阿里HBase超详实践总结 | 一文读懂大数据时代的结构化存储

HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构...

轻松学会多线程(一)——大数据时代需要多线程

在大数据,高并发的需求中,如何让自己所在的企业,在物竞天择的恶劣环境下,生存并且更好的生存下来呢?这就避免不了编写并发程序。而且在软件设计之初,我们就要考虑,哪些串行程序使用并行方式运行会更加高效。这...

大数据时代

  • 2015-09-22 16:44
  • 2.29MB
  • 下载

大数据时代

  • 2017-08-26 15:18
  • 2.29MB
  • 下载

大数据时代的图表可视化利器——highcharts,D3和百度的echarts

还记得阿里巴巴那个令人澎湃激情的双十一吗?还记得淘宝生动形象地把你的的消费历程一一地展示给你看吗?还记得那些酷炫拽的it报告图表吗?在这个大数据越来越盛行的年代,怎样去表达一些用户的关系,人物的关联,...

大数据时代

  • 2014-11-24 16:31
  • 2.29MB
  • 下载

大数据时代

  • 2014-12-18 22:57
  • 2.29MB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)