大数据,科研论文发表分析

本文分析数据来自于Web of Science, Google trend.

这篇文章准备从论文发表的角度分析,“大数据”为主题的论文有什么样的特征,这些内容对于特别是希望在这个领域发表论文的人会有帮助。

<1> 不同于前面两篇文章,这次我将会主要以统计信息客观的反应“大数据”在搜索引擎中被索引的热度,还有已发表的论文统计结果能够展现出怎样的特性。

      首先,在goole trend中同时添加"big data"和"cloud computing"这两个词,google服务器会为我们计算出这两个词的关注度随时间变化趋势图,这张图反应了从2004年到目前这个时间段内关键词的评分变化。该评分变化反应的是这个关键词相对的关注度变化,google通过自己的统计方式和标准化过程,将关注度记为0-100分。详细计分方法

Figure 1.来自google trend的结果


      图中的英文字母代表了与关键词相关的新闻头条。蓝色表示的是关于“cloud computing”的关注度,从2008年开始年关注度震荡上升,2011年达到顶峰到今天回落到50,2年的时间下跌了将近50%;再看看红色曲线代表的“big data”,从2012年起,开始高强度的进入公众的视野,用了1年的时间几乎复制云计算的神话。最高达到将近40的关注度。这个结果完全符合Gartner曲线,也印证了笔者之前两篇文章的分析。[1]   [2]


      对于红色反应的“big data”,尽管的一篇名为Bigging up big data: Why the hype is about to stop的文章中。引用了Gartner一位分析师的话,最终把该技术发展势头不足的原因归结于采用的实现技术Hadoop早已经存在,并且快要过时了无法满足“大数据”的要求,这样的结论是没有根据的,hadoop只是一个开源的对数据进行分布式处理的软件框架,它的过时并不能代表大数据行不通,或许已经存在或者即将产生更多的商用且比MapReduce方法更强大有效地实现技术,所以hadoop的走势并不能代表大数据的走势。

         反观上面那条蓝色的曲线,同样在2009年初和2010年7月,“cloud computing”曾经出现过2次明显的关注度下滑,但是随后有了迅猛的回升,我认为原因是在某些方面产生了突破,比如在前沿的科研范围内有了新的理论或者新的工程技术诞生,或者是过往的科学成果实现了商业化而且有了比较乐观的成效。

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值