爬虫小练习1

最新推荐文章于 2019-08-31 20:32:00 发布

byakki

最新推荐文章于 2019-08-31 20:32:00 发布

阅读量1.5k

点赞数

分类专栏： python3网络爬虫开发实战

本文链接：https://blog.csdn.net/byakki/article/details/89305570

版权

python3网络爬虫开发实战专栏收录该内容

9 篇文章 4 订阅

订阅专栏

请在豆瓣任意找一本图书，抓取它某一页的短评并进行页面解析将短评文字抽取后输出，再对其中的评分进行抽取计算其总分。

import requests
from bs4 import BeautifulSoup
import re
sum = 0
url = 'https://book.douban.com/subject/1456692/comments/'

r = requests.get(url)

soup = BeautifulSoup(r.text,'lxml')
pattern = soup.find_all('span','short')
for item in pattern:
    print(item.string)

pattern_s = re.compile('<span class="user-stars allstar(.*?)rating"')

p = re.findall(pattern_s,r.text)
for star in p:
    sum += int(star)
print(sum)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

byakki

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
爬虫小练习1

请在豆瓣任意找一本图书，抓取它某一页的短评并进行页面解析将短评文字抽取后输出，再对其中的评分进行抽取计算其总分。import requestsfrom bs4 import BeautifulSoupimport resum = 0url = 'https://book.douban.com/subject/1456692/comments/'r = requests.get(u...
复制链接

扫一扫