python3爬虫实战之豆瓣电影250

最新推荐文章于 2023-07-02 06:15:45 发布

亥虫

最新推荐文章于 2023-07-02 06:15:45 发布

阅读量1.3k

点赞数 1

分类专栏： python # 爬虫文章标签： python 爬虫

本文链接：https://blog.csdn.net/weixin_39020133/article/details/78233354

版权

准备工作：
1、观察要网址的结构
https://movie.douban.com/top250?start=0&filter=：？问号后面的参数，start代表页码，每页展示25部电影，0代表第一页，以此类推25代表第二页，50代表第三页…
filter顾名思义，是过滤已经看过的电影，在这里不重要，可以不管。
2、分析网页源代码
打开上面的网址，查看源代码

<ol class="grid_view">
        <li>
            <div class="item">
                <div class="pic">
                    <em class="">1</em>
                    <a href="https://movie.douban.com/subject/1292052/">
                        <img alt="肖申克的救赎" src="./豆瓣电影 Top 250_files/p480747492.webp" class="">
                    </a>
                </div>
                <div class="info">
                    <div class="hd">
                        <a href="https://movie.douban.com/subject/1292052/" class="">
                            <span class="title">肖申克的救赎</span>
                                    <span class="title">&nbsp;/&nbsp;The Shawshank Redemption</span>
                                <span class="other">&nbsp;/&nbsp;月黑高飞(港)  /  刺激1995(台)</span>
                        </a>


                            <span class="playable">[可播放]</span>