作文下载
准备工具
- 本机环境:Windows10专业版
- 操作系统:64位
- Python版本:python 3.8
- 运行工具:PyCharm 2020.2
步骤分析与代码实现(最后附源码)
开始之前先导入一些库
import requests
from lxml import etree
-
获取网页源代码
打开一个网站分析一下
1就是url
2是文章标题
3是内容
之后会放进代码里,先获取到这个界面的网页url = requests.get('https://www.chnlib.com/zuowenku/') html = url.content.decode()#对乱码处理,这里没写内容默认值就是‘UTF-8’ print(html)
返回结果