Python—爬虫应用BeautifulSoup爬取菜谱
以实际案例加深我们对于BeautifulSoup模块的印象。
完全可以自己按照所学把对应的信息找出来,再写代码实现,最后再来进行参考。
下面直接上代码,老规矩,请和我一起敲代码哟!!!
只提取第一个菜名和连接
import requests #加载requests库
from bs4 import BeautifulSoup #加载BeautifulSoup库
res_foods = requests.get('http://www.xiachufang.com/explore/') #从网站获取数据
bs_foods = BeautifulSoup(res_foods.text,'html.parser') #解析数据
list_foods = bs_foods.find_all('div',class_ = 'info pure-u') #找到我们需要提取数据的最小父级标签
tag_a = list_foods[0].find('a') #我们只提取第一个数据,所以别忘记加入角标[0],再接着寻找正确的标签
print(tag_a.text