小爬虫
requests 用来发送http请求
bs4 用来解析网页
chardet 用来检测网页编码格式
导包
import json
import requests
from bs4 import BeautifulSoup
import chardet
from lxml import html
import xml
存储爬取信息的文本文件。a为追加模式,新增信息始终放在已有的信息后面,这样已有的内容就不会被覆盖
f = open("E:\info..
原创
2021-03-26 10:49:26 ·
321 阅读 ·
0 评论