python爬虫 提取豆瓣Top250电影信息
思路很简单,先将原网页爬取出来,然后用正则表达式和BeautifulSoup两种方法提取想要的信息,这里暂时先只爬取电影名、导演、评分和标语。import reimport csvimport requestsfrom bs4 import BeautifulSoupfrom urllib.parse import urlencoderoot = 'https://movie.douban.com/top250'para = {'start': 0, 'filter': ''}header
原创
2021-07-25 23:48:23 ·
1827 阅读 ·
1 评论