准备工具
- 本机环境:Windows10专业版
- 操作系统:64位
- Python版本:python 3.8
- 运行工具:PyCharm 2020.2
步骤分析与代码实现(最后附源码)
开始之前先导入一些库
import requests
from lxml import etree
-
获取网页源代码
打开一个网站分析一下
1就是url
2是文章标题
3是内容
之后会放进代码里,先获取到这个界面的网页
url = requests.get('https://www.chnlib.com/zuowenku/')
html = url.content.decode()