使用requests和BeautifulSoup爬取豆瓣电影top250信息

最新推荐文章于 2022-01-05 15:34:48 发布

BeAChestnut

最新推荐文章于 2022-01-05 15:34:48 发布

阅读量2.8k

点赞数 3

本文链接：https://blog.csdn.net/qq_43509940/article/details/91898933

版权

第一次练习爬虫，爬取的是豆瓣电影top250的信息'''豆瓣电影top250 https://movie.douban.com/top250第二页https://movie.douban.com/top250?start=25第三页https://movie.douban.com/top250?start=50一共10页'''import requestsfrom bs4 imp...

摘要由CSDN通过智能技术生成

第一次练习爬虫，爬取的是豆瓣电影top250的信息

'''
豆瓣电影top250 https://movie.douban.com/top250
第二页https://movie.douban.com/top250?start=25
第三页https://movie.douban.com/top250?start=50
一共10页
'''

import requests
from bs4 import BeautifulSoup
import re
#获得html页面
def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()
        r.encoding = "utf-8"
        return r.text
    except:
        return ""
#爬取需要的内容
def parserPage(list, html):
    soup = BeautifulSoup(html, 'html.parser')
    infoFilm = soup.find

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

BeAChestnut

关注关注

3
点赞
踩
19

收藏

觉得还不错? 一键收藏
2
评论
使用requests和BeautifulSoup爬取豆瓣电影top250信息

第一次练习爬虫，爬取的是豆瓣电影top250的信息'''豆瓣电影top250 https://movie.douban.com/top250第二页https://movie.douban.com/top250?start=25第三页https://movie.douban.com/top250?start=50一共10页'''import requestsfrom bs4 imp...
复制链接

扫一扫