准备工具
- 本机环境:Windows10专业版
- 操作系统:64位
- Python版本:python 3.8
- 运行工具:Python 3.8.0 Shell
前言
今天有点难,因为我的PyCharm体验到期了,运行工具就用python3.8自带的IDLE(好的coder要学废用各种工具!)
步骤分析与代码实现
开始之前先导入一些库
import urllib.request
from urllib import request
from bs4 import BeautifulSoup
- 获取网页源代码,对网页的分析我在上一个练习上已经介绍过,这里就不做介绍了,今天介绍一下新的获取网页代码的方式,添加
header
,就是伪装成浏览器避免反爬。怎么去查看一个网页的header
呢还是利用F12
随便找一个有图片的网站,我这里网络有些问题一些CSS
样式加载不出来,不要紧,关键看截图点开N