爬虫1_2019年豆瓣新片排行榜

最新推荐文章于 2024-04-02 00:01:19 发布

年纪轻轻keep_coding

最新推荐文章于 2024-04-02 00:01:19 发布

阅读量458

点赞数 1

分类专栏：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35629706/article/details/104732603

版权

爬虫专栏收录该内容

3 篇文章 0 订阅

订阅专栏

from bs4 import BeautifulSoup
import requests
import lxml


def request_douban(url):
    try:
        headers = {'user-agent': 'my-app/0.0.1'}  # 伪装成浏览器，避免403，被禁止访问
        response = requests.get(url, headers=headers)
        if response.status_code == 200:
            return response.text
    except requests.RequestException:
        return None


def main(url):
    html = request_douban(url)
    soup = BeautifulSoup(html, 'lxml')  # 源码
    moives_list = soup.find(class_="").find_all('tr')
    # print(moives_list)
    for item in moives_list:
        # print(item)
        # item_name = item.find(class_='title').string
        try:
            item_name = item.find(class_='nbg').get('title')
            item_img = item.find('a').find('img').get('src')
            item_score = item.find(class_="rating_nums").string
            item_comment = item.find(class_="star clearfix").find(class_="pl").string
            print('电影名:{:<10}评分:{:<5}评价人数:{:<10}封面:{}'.format(item_name, item_score, item_comment, item_img))
            print('-'*50)
        except:
            print('Error')


if __name__ == "__main__":
    url = 'https://movie.douban.com/chart'
    main(url)

年纪轻轻keep_coding

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

年纪轻轻keep_coding CSDN认证博客专家 CSDN认证企业博客

码龄8年

25: 原创

52万+: 周排名

11万+: 总排名

3万+: 访问

: 等级

574: 积分

63: 粉丝

32: 获赞

14: 评论

89: 收藏

私信

关注

热门文章

分类专栏

最新评论

PPOCRv3在ncnn端部署
打马诗人: 感谢博主，使用你的方法，ppocrv4也可以转成功，可以在ncnn中正常推理。
opencv x86(32位) windows下vs2019编译问题
年纪轻轻keep_coding: 找不到自己之前编译的了，你可以从这里获得opencv x86的版本https://github.com/RapidAI/RapidOCR/releases
opencv x86(32位) windows下vs2019编译问题
我要成果: 请问博主有没有编译好的，能否发一份？
PPOCRv3在ncnn端部署
年纪轻轻keep_coding: 之前根据"paddle转onnx转ncnn"方案转过检测模型，好像没遇到什么问题。文中提到的"paddle转pt转ncnn"的方案应该也可以吧。 paddlepaddle-gpu 2.4.0.post117 torch 1.7.1+cu101
PPOCRv3在ncnn端部署
siyueyourena: 请问博主检测模型(ppocrv3) 是用什么方式转的，我在 ubuntu20.04 上转换时总是遇到各种环境问题，博主的转换环境是怎样配得呢 paddle 的版本和 torch 的版本是多少

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。