google+stackoverflow_访问量最高超7百万的Stack Overflow问题竟然是...

d5cae56e30eecd0b29f121d68a21a97a.png

a6e2b4a63dfcbf991d7a8911bf487a85.png
整理 | Jane
出品 | AI科技大本营(公众号id:rgznai100)

Stack Overflow,一个面向开发者的 IT 技术问答网站,很多程序员都会在上面提问,浏览问题,查找技术知识。在 Top Question 页面,我们可以根据 Hot、Week、Month,亦或是标签对问题进行筛选过滤。当我们想对上面的问题进行数据统计与分析时,这些功能显然不够直观与聚合。

cded546d974174a81f9d060fcda385e7.png

近日,一位来自 Google 的开发者 Felipe Hoffa 发表了一篇文章,分析 Stack Overflow 上不同时间、不同语言的热门问题,他用了一个交互式的数据展示界面,无论是让概览问题还是分析数据都变得非常简单。

首先,你可以在左上方的折线图中看到不同时间的热门问题 Top10(时间统计单位为季度)

48584dc6a44e8cec2cc36772892d2836.png

其次,你可以在右侧的选项栏中根据 tag、 top for quarter、section 和 subtag 四个选项进行数据筛选。

技术类别根据此类问题浏览总量由低到高排列。

0d5cbd421cd19eb85189beb6cb87b468.png

选择 tag 后,还可以选择此技术类别下的 sub tag。

c6fc2a4ca2d3bd9f59d06e22b687b38f.png

问题不仅可以看 Top10,还可以看 Top30 前的三个区间。

而在问题罗列区,我们可以看到除问题本身外,还有问题发起时间、回答数量及排名等信息。

c6fc2a4ca2d3bd9f59d06e22b687b38f.png

有了上面这些内容与数据的直观展示,作者对一些数据进行了统计与分析,下面我们就一起来看看 Stack Overflow 上的用户在过去和现在都在关注哪些问题。

1.最热门的问题:所有时间 VS 2018 Q4

下面的数据显示的是在 Stack Overflow 上,迄今为止关注度最高的十个问题:

c4b2b7621de88e76bb96d8518948d8f3.png

最火的十个问题涉及了五个话题,4 个与 Git 相关,3 个与 JavaScript 有关,Java、Linux 和 html 的问题各有一个,没有任何一个问题涉及目前很火热的 AI、大数据乃至 Python 等技术领域。

也许受时间积累的影响?那我们回到最近一个季度(2018 Q4)的数据中,看看哪些是近几个月有哪些热门问题?

5f052f7a1b067c0fa5a1b97a3d6b350c.png

两个图表的数据对比发现,近期的十个热门问题中,新增了 4 个 Python 问题,其他 6 个并没有发生变化。问题“如何撤销 Git 中最新的 commits?”一直位居 Top1 的位置,浏览量直逼 8 百万,仅上个季度的浏览量就达到了 40 万+,但是都没有 Java 的问题上榜。

2.问题领域发生了哪些变化?

493f385dcbe4aacd2ff26e5805fa03b3.png

320ccc8c505501e99a70d302482c4823.png

看过 Top 10 的数据后,我们把数据范围拓展到热门问题 Top30。Python 相关的问题成为最近最受关注的领域,相比全部时间里的问题 Top 30,最近的一个季度里,已经没有 Java 和 SQL 相关的问题了。

3.JavaScript、Python 和 Go 三类语言中,最受关注的十个问题(时间截止到 2018 Q4)

下面的三幅图分别展示了截止到 2018 年的 Q4,JavaScript、Python 和 Go 语言的问题 Top 10,以及这十个问题在过去两年的时间里的变化趋势:

  • 学 JavaScript 的开发者们一直在问“如何从数组中删除特定元素?”
  • Python 学习者们问的最多的问题是“使用 for 循环迭代字典”
  • 而 Go 语言的开发者们最想知道“将字节数组转换成字符串的最佳方法”

我们还能从图中看到,随时间的推移,大部分问题的关注度并没有很大的波动,然而却也有一两个问题,上升趋势变化非常明显、突出。比如:

2b55db5bf9e39c71a5fa65d625bc0dd6.png

JavaScript 问题中“如何获取当前数据”与”如何四舍五入时,保留小数后面两位“,这两个问题(蓝色与紫色)在 2017 年的 Q3 和 Q4 期间分别有关注度下降的趋势,但随后关注度反升,并且以很快的速度缩短了与其他问题访问量的差别,截止到 2018 年 Q4,差距已经远没有一开始时悬殊了。

08766a506e809472b154419cc3e462a7.png

Python 问题也有此类现象,”如何将字符串解析为浮点数或整数“,这个问题从 2017 年的 Q4 季度到 2018 年的 Q3 季度,近一年的时间都是下降趋势,然而就从 2018 年 Q3 季度开始却突然反温,一下减少了与上一名问题之间的差距。

更有甚者,问题”如何利用 Pandas 在数据结构中根据列选择行“,在一开始并没有太多人问,却从 2017 年 Q4 季度开始上升势头迅猛,不断超过其他问题,跃居 Top5。这一年中学习使用 Pandas 的开发者们看来增多了不少啊!

dfde42dc8b0d13794003176f362d4b60.png

Go 语言的问题中,”如何列出目录中所有文件“这个问题的关注度一直在增加,到最后还反超了两个问题的浏览量。

这些问题是否也曾让你纠结烦恼呢?

广告朝花夕誓-于离别之朝束起约定之花
主演:石见舞菜香 / 入野自由 / 茅野爱衣
猫眼电影演出

4.TensorFlow 的挣扎

怎么能少了近几年发展最快的人工智能领域。开发者们在 AI 技术领域中又在频频问哪些问题呢?

ff4618fb7b11a56356cf73779c205660.png

TensorFlow 可以说是使用人数最多的深度学习框架了,问的最多的问题是”不能用 pip 方法找到 TF“、”怎么查询我系统中安装 TF 的版本信息“或是当前 CPU/GPU 组合能力等问题。看来大家在入门时遇到了很多共同问题,相信这些问题随着时间的推移,也仍然是最常被问的问题。

5.其他类别的热门问题 Top10

1.Redis 及子类与 Java 和 C# 相关的问题

开发者们问的最多的是”如何在 Windows 上安装“。Redis+Java 中的问题大多与 Spring 相关,和 C# 中问的最多的是想要简单实例。

3a81aa6ac04e60812e94df574932c534.png

e96748ef174f535eed26c1456dd58ad3.png

85a07fa93a8807cfac636259099ee722.png

大家如果想看更多分析与查询语句,可访问

https:// towardsdatascience.com/ finding-the-real-top-stack-overflow-questions-aebf35b095f1

最后,给大家分享这个数据交互界面的地址,看看 Stack Overflow 上的小伙伴们都在问些什么?

数据交互界面: https:// datastudio.google.com/r eporting/1UUTtohIB1fBH7e8An-6AhEn4AyU3eMjd/page/QwNg

(本文为AI科技大本营原创文章,转载请微信联系 1092722531)

❤添加小助手微信csdnai2,备注研究方向,邀你加入读者群

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值