python爬取网页题库_用Python爬取本站离线题库

## 这是哪一题?

每当遇到一个新的题目,也许似曾相识、也许从未见过,无论什么情况,尤其在c语言网参加比赛时,为了更快的找到此题的原始题号,往往颇费周折:如果感觉这题做过,首先,根据新题的某些关键字,调用题库的“题目搜索”功能,希望关键字就在题目里,可惜大多数题目与内容的差别很大,常常找不到;于是,又要求助于搜索引擎,把站名、题目的来源、内容里的部分文字都一一罗列出来,才有可能让网络“猜”到这到底是哪一题,题目是什么?很不巧的是,搜索引擎对此也无能为力。

为了搜索到匹配信息,该怎么办呢,有办法,比如在每次做题的时候,伴随代码,把题目和内容也粘贴到代码文件里,在本地搜索就方便多了。

可是目前在本地都做了快2000题了,大部分代码文件都只能匹配题号,没有需求描述,如果不想重做这些题,该怎么找?难道要重新访问这2000个页面,把题目描述一个个地粘贴到代码文件中?不!这不是程序员的做法,真正的程序员可以让机器来完成,让爬虫来实现!

## 怎样获取离线题库

直接看代码:

```python

#!/usr/bin/env python3

# -*- coding: UTF-8 -*-

import os

import requests

url_prefix = "https://www.dotcpp.com/oj/problem"

<
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值