python爬虫豆瓣250排行书籍

爬虫代码

# 豆瓣图书Top250

import requests
from bs4 import BeautifulSoup

for page in range(10):
    url = 'https://book.douban.com/top250?start={}'.format(page*25)
    r = requests.get(url).text
    bsObj = BeautifulSoup(r,'html.parser')
    td_tags = bsObj.find_all('td',{'valign':'top','width':None})
    #print(td_tags)
    for td_tag in td_tags:
        try:
            name = td_tag.find('a').get_text().strip('\n').replace('\n','').replace(' ','')
            info = td_tag.find('p',{'class':'pl'}).get_text()
            rating_nums = td_tag('div',{'class':'star clearfix'})[0].get_text().replace('\n','').replace(' ','')
            jianjie = td_tag.find('span',{'class':'inq'}).get_text()
            dd = name + '\n' + info + '\n' + rating_nums + '\n' + jianjie + '\n'
            #print(dd)
            with open('E:/douban_book/douban_book.txt','a+',encoding='utf-8') as f:
                f.write(dd + '\n')
        except:
            continue

如果报错 no module named requests
可以 pip install requests安装
在这里插入图片描述

no module named beautifulsoup
可以pip install beautifulsoup4 安装
在这里插入图片描述

查看装了那些扩展,成功与否
在这里插入图片描述

执行文件结果
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值