![461e2ad4614756a09d9d573d44f1ccb5.png](https://i-blog.csdnimg.cn/blog_migrate/3cbefb122d8923f793598a06ccc21c58.jpeg)
整理 | Jane
出品 | AI科技大本营(公众号id:rgznai100)
Stack Overflow,一个面向开发者的 IT 技术问答网站,很多程序员都会在上面提问,浏览问题,查找技术知识。在 Top Question 页面,我们可以根据 Hot、Week、Month,亦或是标签对问题进行筛选过滤。当我们想对上面的问题进行数据统计与分析时,这些功能显然不够直观与聚合。
![f4c66cb4f5ceeb39b3d96373c0515ff3.png](https://i-blog.csdnimg.cn/blog_migrate/3f26e2db32dc1d64d49dc178783be91f.jpeg)
近日,一位来自 Google 的开发者 Felipe Hoffa 发表了一篇文章,分析 Stack Overflow 上不同时间、不同语言的热门问题,他用了一个交互式的数据展示界面,无论是让概览问题还是分析数据都变得非常简单。
首先,你可以在左上方的折线图中看到不同时间的热门问题 Top10(时间统计单位为季度)
![fc821e3dd4f297f41079a74360b00492.png](https://i-blog.csdnimg.cn/blog_migrate/b0a714fd22b9ba4b5ed5e930ccdfe37e.jpeg)
其次,你可以在右侧的选项栏中根据 tag、 top for quarter、section 和 subtag 四个选项进行数据筛选。
技术类别根据此类问题浏览总量由低到高排列。
![423c72fc433f6afc8db7c6c0eaad75c2.png](https://i-blog.csdnimg.cn/blog_migrate/7cc79157ae10f04e91a85f4bc7c5ea02.jpeg)
选择 tag 后,还可以选择此技术类别下的 sub tag。
![d956d839e4c9e29bb231e834a0ba67b2.png](https://i-blog.csdnimg.cn/blog_migrate/608d1a799de79c3c306aa6b8951e81ce.jpeg)
问题不仅可以看 Top10,还可以看 Top30 前的三个区间。
而在问题罗列区,我们可以看到除问题本身外,还有问题发起时间、回答数量及排名等信息。
![d956d839e4c9e29bb231e834a0ba67b2.png](https://i-blog.csdnimg.cn/blog_migrate/608d1a799de79c3c306aa6b8951e81ce.jpeg)
有了上面这些内容与数据的直观展示,作者对一些数据进行了统计与分析,下面我们就一起来看看 Stack Overflow 上的用户在过去和现在都在关注哪些问题。
1.最热门的问题:所有时间 VS 2018 Q4
下面的数据显示的是在 Stack Overflow 上,迄今为止关注度最高的十个问题:
![c694ace0efbc4de0276d4cfc6ce9e9df.png](https://i-blog.csdnimg.cn/blog_migrate/046baf104dfb709a6c86aca71a91ed06.jpeg)
最火的十个问题涉及了五个话题,4 个与 Git 相关,3 个与 JavaScript 有关,Java、Linux 和 html 的问题各有一个,没有任何一个问题涉及目前很火热的 AI、大数据乃至 Python 等技术领域。
也许受时间积累的影响?那我们回到最近一个季度(2018 Q4)的数据中,看看哪些是近几个月有哪些热门问题?
![ca7a67af69bb871b1d567d748490b4af.png](https://i-blog.csdnimg.cn/blog_migrate/fde43d39e9f3b18679fbefeebe1fd93c.jpeg)
两个图表的数据对比发现,近期的十个热门问题中,新增了 4 个 Python 问题,其他 6 个并没有发生变化。问题“如何撤销 Git 中最新的 commits?”一直位居 Top1 的位置,浏览量直逼 8 百万,仅上个季度的浏览量就达到了 40 万+,但是都没有 Java 的问题上榜。
2.问题领域发生了哪些变化?
![5f698887c478167646a4cf55e63d6d43.png](https://i-blog.csdnimg.cn/blog_migrate/8248682c557bede063c4892f38f93951.jpeg)
![af267e5bc1341c8ccd69ee56ae6dbd74.png](https://i-blog.csdnimg.cn/blog_migrate/ec997d6e564a6772c556d5e42d668240.jpeg)
看过 Top 10 的数据后,我们把数据范围拓展到热门问题 Top30。Python 相关的问题成为最近最受关注的领域,相比全部时间里的问题 Top 30,最近的一个季度里,已经没有 Java 和 SQL 相关的问题了。
3.JavaScript、Python 和 Go 三类语言中,最受关注的十个问题(时间截止到 2018 Q4)
下面的三幅图分别展示了截止到 2018 年的 Q4,JavaScript、Python 和 Go 语言的问题 Top 10,以及这十个问题在过去两年的时间里的变化趋势:
- 学 JavaScript 的开发者们一直在问“如何从数组中删除特定元素?”
- Python 学习者们问的最多的问题是“使用 for 循环迭代字典”
- 而 Go 语言的开发者们最想知道“将字节数组转换成字符串的最佳方法”
我们还能从图中看到,随时间的推移,大部分问题的关注度并没有很大的波动,然而却也有一两个问题,上升趋势变化非常明显、突出。比如:
![18826da5cbe8c29d5c543c0ca7b1db8c.png](https://i-blog.csdnimg.cn/blog_migrate/a2f7f9b5b0a0f882690e8eefd489492d.jpeg)
JavaScript 问题中“如何获取当前数据”与”如何四舍五入时,保留小数后面两位“,这两个问题(蓝色与紫色)在 2017 年的 Q3 和 Q4 期间分别有关注度下降的趋势,但随后关注度反升,并且以很快的速度缩短了与其他问题访问量的差别,截止到 2018 年 Q4,差距已经远没有一开始时悬殊了。
![79e62a5db34c9b4dd6991c5292863dab.png](https://i-blog.csdnimg.cn/blog_migrate/98226462f6a26e7f3fb588f19e04c7a0.jpeg)
Python 问题也有此类现象,”如何将字符串解析为浮点数或整数“,这个问题从 2017 年的 Q4 季度到 2018 年的 Q3 季度,近一年的时间都是下降趋势,然而就从 2018 年 Q3 季度开始却突然反温,一下减少了与上一名问题之间的差距。
更有甚者,问题”如何利用 Pandas 在数据结构中根据列选择行“,在一开始并没有太多人问,却从 2017 年 Q4 季度开始上升势头迅猛,不断超过其他问题,跃居 Top5。这一年中学习使用 Pandas 的开发者们看来增多了不少啊!
![9d20497ad21c99a68fc1dc2c0ede9789.png](https://i-blog.csdnimg.cn/blog_migrate/2c5696df2720057417728ed5b0039854.jpeg)
Go 语言的问题中,”如何列出目录中所有文件“这个问题的关注度一直在增加,到最后还反超了两个问题的浏览量。
这些问题是否也曾让你纠结烦恼呢?
猫眼电影演出
4.TensorFlow 的挣扎
怎么能少了近几年发展最快的人工智能领域。开发者们在 AI 技术领域中又在频频问哪些问题呢?
![d26dcd8414af9a259182dec1b66337be.png](https://i-blog.csdnimg.cn/blog_migrate/19ba32568ee54ac350d78a0750fb54d9.jpeg)
TensorFlow 可以说是使用人数最多的深度学习框架了,问的最多的问题是”不能用 pip 方法找到 TF“、”怎么查询我系统中安装 TF 的版本信息“或是当前 CPU/GPU 组合能力等问题。看来大家在入门时遇到了很多共同问题,相信这些问题随着时间的推移,也仍然是最常被问的问题。
5.其他类别的热门问题 Top10
1.Redis 及子类与 Java 和 C# 相关的问题
开发者们问的最多的是”如何在 Windows 上安装“。Redis+Java 中的问题大多与 Spring 相关,和 C# 中问的最多的是想要简单实例。
![7bfb55c4b0d63ba9cb858a52407ee73f.png](https://i-blog.csdnimg.cn/blog_migrate/32149869b2d394d2594a7d13c354c824.jpeg)
![2eb335e172ceb67e707c1a52005ef761.png](https://i-blog.csdnimg.cn/blog_migrate/904b7c2aa82f8e34f93bcc31767e2058.jpeg)
![21556408711e9b7b88097554cb8b337f.png](https://i-blog.csdnimg.cn/blog_migrate/6cab480eb330bd0e19b0d2f1580a97c1.jpeg)
大家如果想看更多分析与查询语句,可访问
https://towardsdatascience.com/finding-the-real-top-stack-overflow-questions-aebf35b095f1
最后,给大家分享这个数据交互界面的地址,看看 Stack Overflow 上的小伙伴们都在问些什么?
数据交互界面:https://datastudio.google.com/reporting/1UUTtohIB1fBH7e8An-6AhEn4AyU3eMjd/page/QwNg
(本文为AI科技大本营原创文章,转载请微信联系 1092722531,添加微信csdnai2,备注公司+研究方向,和志同道合的小伙伴一起探讨AI技术)