练手程序
这不是一个名字
厚积薄发
展开
-
爬取广西空中课堂开课至今所有url链接(高中、初中、小学)
真的是闲的慌,自己作业都没写 # -*- coding: utf-8 -*- import scrapy import re from bs4 import BeautifulSoup import os class GetalllinkSpider(scrapy.Spider): name = 'getalllink' # allowed_domains = ['zt.g...原创 2020-02-27 22:16:01 · 1932 阅读 · 0 评论 -
广西空中课堂五年级每日爬取教学视频(使用工具:scrapy selenium re BeautifulSoup)
这几天由于特殊原因,闲在家中无事干,恰逢老妹要在家上课,家里没有广西广电机顶盒,所以只能去网上下载下来放到电视上看。前段时间又学了点爬虫正好拿来练练手(已查阅网站无robots协议限制) 网站链接:广西空中课堂 # -*- coding: utf-8 -*- import scrapy from bs4 import BeautifulSoup import re import dateti...原创 2020-02-23 17:29:34 · 462 阅读 · 0 评论