GitHub 作为程序员每天必逛的网站之一,上面有着太多优秀的开源项目,今天就给带大家来梳理下在过去的一年里,GitHub 上最火的 Python 项目 Top10。
数据获取
如果你留心看过 GitHub 的文档的话,你就会知道关于 GitHub 上的大部分数据,GitHub 官方都是提供了接口了的。比如我们今天要获取的数据就可以从下面这个接口拿到。
https://api.github.com/search/repositories?q=language:python+created:%3E2019-12-31&sort=stars&order=desc&per_page=10
复制代码
如上所示,我们只获取语言为 Python 的开源项目,且创建时间晚于 2019-12-31,也就是 2020 年新创建的开源项目才做统计,接下来我们按照 stars 数倒序排序,取前十条记录就拿到我们需要的数据啦。
由于该接口返回的开源项目信息过于庞大,我们只取项目名称,URL,fork 数,star 数以及 watch 数。
# 获取数据
def get_data():
base_url = 'https://api.github.com/search/repositories?q=language:python+created:%3E2019-12-31&sort=stars&order=desc&per_page=10'
response = requests.get(base_url)
result = response.json()
data = {}
for item in result['items']:
data[item['name']] = [item['html_url'], item['stargazers_count'], item['watchers_count'], item['forks']]
return data
复制代码
可视化
# 可视化
def show_img():
data = get_data()
names = list(data.keys())
values = [data[name][1] for name in names]
bar = (
Bar()
.add_xaxis(names[::-1])
.add_yaxis(&#