爬虫三大库之BeautifulSoup库
1、如何使用:
import requests
from bs4 import BeautifulSoup
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
res=requests.get('http://bj.xiaozhu.com/',headers=headers)
soup=BeautifulSoup(res.text,'lxml')
print(soup.prettify())
2、BeautifulSoup库的主要解释器及其优缺点:
3、find_all()方法
find()方法
selector()方法