python 学习笔记简单爬虫

最新推荐文章于 2022-07-17 18:20:25 发布

朝歌1122

最新推荐文章于 2022-07-17 18:20:25 发布

阅读量195

点赞数

分类专栏： Python 文章标签： Python 爬虫

本文链接：https://blog.csdn.net/qq_40452317/article/details/80383593

版权

Python 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一个个简单的爬虫，爬取豆瓣网的电影top250
代码如下：

import requests
from pyquery import PyQuery as pq
for url in ['https://movie.douban.com/top250?start={}'.format(page) for page in range(0,225,25)]:
    html = requests.get(url).text
    for item in pq(html)('.item').items():
        num = item.find('.pic em').text()
        title = item.find('.title').text()
        title1 =str(title,'utf-8')
        img = item.find('.pic img').attr('src')
        start = item.find('.rating_num').text()
        print (num , title1 , start , img)