Python爬虫（BeautifulSoup）实战：抓取豆瓣读书新书速递模块

最新推荐文章于 2024-07-24 17:16:09 发布

银二码

最新推荐文章于 2024-07-24 17:16:09 发布

阅读量775

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/qq_22502303/article/details/83587652

版权

python 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

import requests
from bs4 import BeautifulSoup

html = requests.get('https://book.douban.com/').text
soup = BeautifulSoup(html, 'lxml')
html_content = soup.select('#content .slide-list li')

print('################################################################################################################################')

for i in html_content:
    book = i.select('.cover a')
    if len(book):
        name = book[0].attrs['title']
        link = book[0].attrs['href']
        print('书名：%s,链接：%s' % (name, link))


print('################################################################################################################################')