爬取GitHub上项目热度排名

本文参考《python编程 从入门到实践》,在其基础上略作修改,供学习参考

导入模块

import requests
import pygal
from pygal.style import LightColorizedStyle as LCS, LightenStyle as LS
from urllib.error import URLError, HTTPError, ContentTooShortError

执行API调用并存储响应

url = 'https://api.github.com/search/repositories?q=language:python&sort=stars'

抓取网页、处理数据

def download(url, num_retries=100):
    try:
        html = requests.get(url)
    except (URLError, HTTPError, ContentTooShortError) as e:
        print('Download error:', e.reason)
        html = None
        if num_retries > 0:
            return download(url, num_retries - 1)
    return html

# 创建内容对象
r = download(url)

response_dict = r.json()

print('Total repositories:', response_dict['total_count'])

repo_dicts = response_dict['items']
names, plot_dicts = [], []
for repo_dict in repo_dicts:
    names.append(repo_dict['name'])
    plot_dict = {
        'value': repo_dict['stargazers_count'],  # 显示项目热度
        'label': repo_dict['description'],  # 显示项目介绍
        'xlink': repo_dict['html_url'],  # 点击条形柱,链接项目网页
    }
    plot_dicts.append(plot_dict)

可视化

my_style = LS('#333366', base_style=LCS)

my_config = pygal.Config()
my_config.x_label_rotation = 45
my_config.show_legend = False
my_config.title_font_size = 24
my_config.label_font_size = 14
my_config.major_label_font_size = 18
my_config.truncate_label = 15
my_config.show_y_guides = False
my_config.width = 1000

chart = pygal.Bar(my_config, style=my_style)
chart.title = 'Most-Starred Python Projects on GitHub\nMade on July 29, 2020'
chart.x_labels = names

chart.add('', plot_dicts)
chart.render_to_file('python_repos2.svg')

执行结果返回


点击条形柱可以链接到对应的项目主页

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值