python爬取codeforce题目

本文介绍了使用Python爬取Codeforce编程竞赛平台上的题目,主要针对SGU板块,虽然不涉及将HTML转换为PDF,但提供了简单的方法以便于打印。由于原始网站格式限制,题目代码可能格式不佳。
摘要由CSDN通过智能技术生成

老oj SGU搬家到codeforce上了为了做题方便就将题目爬取下来了 不会将HTML文件PDF化 但只需Ctrl+p打印即可

题目代码是老网站上的格式不是很好只能这样了

下面上码(只能爬取SGU板块的题,其他的题csdn都有)

# -*- coing:utf-8 -*-

import requests
import urllib.request
from bs4 import BeautifulSoup

fweb = open('an.html','w')

def Find_an(soup,url):
    div_ul = soup.find('div',{"class",'problemindexholder'}) #存放题目的<div>
    try :
        img_ul = div_ul.find_all('img') #查找<img>并如果div_ul为空弹出异常
    except :
        return 0
    for img in img_ul:
        url = img['src']  
        url = "http://codeforces.com" + url  #图片地址
        r = requests.get(url, stream=True)  #下载
        image_name = url.split('/')[-1]
        #print(image_name)
        img['src'] = image_name  #相对地址转到本地
        with open('./%s' % image_name, 'wb') as f:  #保存图片
            for c
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值