python爬虫第三关：爬取菜谱网站/爬取豆瓣top250

Sfiaflys

于 2020-07-18 12:54:55 发布

阅读量542

点赞数 1

分类专栏： python爬虫基础文章标签： python

本文链接：https://blog.csdn.net/Sfiaflys/article/details/107423975

版权

这篇博客介绍了如何使用Python进行网络爬虫，包括爬取美食菜谱网站上的热门菜谱信息，如菜名、原材料和烹饪步骤，以及抓取豆瓣电影Top250的详细数据，如电影名、评分、推荐语和链接。

摘要由CSDN通过智能技术生成

1 爬取菜谱网站

目标：爬取热门菜谱清单，内含：菜名、原材料、详细烹饪流程的URL。
url：http://www.xiachufang.com/explore/

import requests
from bs4 import BeautifulSoup
url = 'http://www.xiachufang.com/explore/'
sv = {
   'user-agent': 'Moziller/5.0'}
r = requests.get(url, headers=sv)
r.encoding = 'utf-8'
html = r.text
soup = BeautifulSoup(html, 'html.parser')
items = soup.find_all('div', class_='info pure-u')
print(r.status_code)
ls=[]
for item in items:
    name = item.find('a