google+stackoverflow_Stack Overflow 上最热门问题是什么?

0f6c975d5e4b868da6c38d5a4f1d916a.png

要找到 Stack Overflow 全时最热问题很容易,但是当前最热问题能告诉我们现在的重要话题。在本文中,你可以了解到怎么才能得到当前最热话题。

从下图的交互面板中你可以得到具体问题的答案。下面,我们来看看它是怎么创建的。
交互面板的链接如下:https://datastudio.google.com/reporting/1UUTtohIB1fBH7e8An-6AhEn4AyU3eMjd/page/QwNg

最热 stack overflow 问题 – 全时 vs 当前

ac480956246ed6cc88ab0934464972e8.png

我们可以看到:

最热的全时 Stack Overflow 问题——九年以前创建的超过七百万阅读量——甚至不是一个编程问题: 我怎么才能撤销 Git 里我最近的一次提交?

前十个最热问题,4 个是 git 相关,3 个 JavaScript 相关,一个 Java 相关,一个 Linux 相关,一个 HTML 相关。还差什么?

前十没有 Python 的问题。意不意外?

我们再看看最近一个季度的最热的十个问题:

fd150bc5aa09380d9c5cb006e4b61030.png

我们可以看到:

最热的问题还是“我怎么才能撤销 Git 里我最近的一次提交?”——最近一个季度有 40 万个阅读量。

编程相关的问题变了:现在 10 个问题里面有 4 个与 Python 相关。

Java 不见了——它不再出现在当前最热的十个问题里。

观察最热 30 个问题的标签的话,趋势会更加明显:

b07a7de53b420fb7af23b859e0c3821e.png

Java 和 SQL 已经从前 30 中掉落了。同时 Python 牢牢占据了阅读量前 10 和前 30 的榜单之首。

每个标签的最热问题是什么?

你可以看到任何一个标签的最热问题。在查看每个标签的最热问题之前,你可以先猜一下 JavaScript,Python 和 go 的最热问题是什么。

JavaScript, Python, Go: 问题各不相同

8ff9d1575e2416882b6bb7106d16fd05.png

c525730c404c82782dcb3743ed51a9df.png

cc3637892cabbadd8af07ae62bcfe3c1.png

从这个面板中每个标签的前十个问题以及它们的趋势都一目了然。Python 开发者一直在问“用 for 来遍历字典”,JavaScript 开发者问“我怎么才能从一个数组中移除某个元素”,Go 开发者问“字节数组转 string 的最佳方法是什么”

TensorFlow 问题

723bb18cc2e4f3b193e70b275e855be3.png

人们对机器学习兴趣满满,而 TensorFlow 是该领域最热的项目之一。但是从最热的问题可以看出人们还在挣扎于“用 pip 无法安装 TensorFlow”以及他们当前的 CPU/GPU 能力问题。

TensorFlow 项目组可以用这个面板来追踪这些问题的趋势——比如说研究出一种傻瓜式的方法来用 pip 安装 TensorFlow。

Kotlin 十大热门问题: 当前 vs 以前

用这个面板你可以直接看到在任何一个季度的最热的十个问题。比如说,我们可以来比较一下 Kotlin 在 2018 年第四季度和 2017 年第二季度的最热十个问题:

cfaf6de2bb2496d1297df8629a81d996.png

adf00dd896f52a786c82b71269c14ccd.png

看起来不错:大多数 2017 年的热门问题消失了,可以猜测,这个团队在解决用户遇到的常见问题方面做得很不错。2018 年第四季度的热门问题基本上都是新的,跟几个月以前的完全不一样。

Redis 热门问题——基于 Java vs C#

以下是 Redis 的十大热门问题:

4e6b87c1432fc36b396ffaf75d7ee93a.png

可以看到,当前最热门的问题是怎么在 Windows 上安装 Redis。如果你是打算改进 Java 库的 Redis 开发人员,这个信息对你用处不大——好在这个面板可以过滤出子标签的信息。

我们再来看看 Redis+Java 的前十个热门问题:

60a901549cfb5b5abe8df01c1e0d4e2d.png

如果我们过滤 redis 和 Java,我们会看到不一样的问题:比如说,大多数都与 Redis 和 Spring 有关。
而 Redis 和 C# 的热门问题就大有不同了:

e5658d81c46efddd7d9af486d35147f6.png

有意思的是,Redis+Java 的热门问题问的是 C# 的简要案例。也许开发者们在官方文档中没找到?

一个问题,多个回答

在这个面板上,你还可以看到每个问题有多少回答。比如说,最热门问题“在 Rust 里如何将 String 转换为 int”有 5 个回答。Go 语言的“把字节数组转换为 string 的最好方法是什么”有 12 个不同的回答。

6c1eeedbe6014b228829c0dd40689014.png

a8999b981bd320f48e08aa693ca18b1e.png

往前十更深探索

为什么在前十就停止了?你也可以接着去探索更深入的热门前 30 问题:

508d0369611bb050712cdc29148ec6c2.png

330e75830c07e5f3ecfb0e3b23903ce0.png

怎么实现:queries

你可以在 BigQuery 里面找到所有的数据。每三个月 Stack Overflow 都会公布一份他们最近的数据快照,我们可以拿来副本来做查询。

Stack Overflow 热门问题,当前 vs 全时

dcc9bf6d34c61b56a6c49ee335d204d4.png

查找每个问题在某段时间内的阅读量

首先我存下了这段时间的每个快照的副本,然后开始计算这些快照之间的阅读量的变化。

好在查询语句看起来很简单:

875757e28d311d9d7552c2c7490233e5.png

每个标签的热门问题

f71f678b3ae4ed4c6594eb21a7769653.png

a42a0b9044e23a844b18fcfeb077954b.png

超过一年没有更新的当前最热问题

#standardSQL    
WITH top_questions AS (
  SELECT  id, title, quarter_views, view_count 
  FROM `fh-bigquery.stackoverflow_archive_questions.merged`
  WHERE 'google-cloud-dataflow' IN UNNEST(tags)
  AND quarter='2018-12-01'
), latest_answer AS (
  SELECT parent_id, DATE(MAX(COALESCE(last_edit_date, last_activity_date, creation_date))) answer_last_edit_date 
  FROM `bigquery-public-data.stackoverflow.posts_answers` b
  GROUP BY parent_id
)
SELECT SUBSTR(title, 0,80) title, quarter_views, view_count, answer_last_edit_date
FROM top_questions a
JOIN latest_answer b
ON a.id=b.parent_id
WHERE DATE_DIFF(CURRENT_DATE(), answer_last_edit_date, DAY)>360
ORDER BY quarter_views DESC
LIMIT 10

1460e9327f41efd7c6d6402398d0cf36.png

英文原文:

https://towardsdatascience.com/finding-the-real-top-stack-overflow-questions-aebf35b095f1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值