核心代码:
import re
import requests
from bs4 import BeautifulSoup
def work(dic, url, headers,shop_name):
# 发送请求
response = requests.get(url, headers=headers)
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'lxml')
# 获取所有<li>标签
li_elements = soup.find('div', id='shop-all-list').find('ul').find_all('li')
# 遍历<li>标签
for li in li_elements:
# 店名
name = li.find('h4').get_text(strip=True)
# 评价
# review_num = li.find('a', class_='review-num').find('b').get_text(strip=True) + '条评价'
# 人均(不知道为什么有时候会报错,所以加个报错处理)
# 初始化变量以存储b标签的文本
text = ""
# # 使用try-except语句来捕获可能发生的异常
# try:
# # 尝试找到a标签,然后找到b标签,并获取文本
# a_element = li.find