Python爬虫教程006：利用request + BeautifulSoup 模块批量爬取内容，实现批量获取书名对应的豆瓣评分

文理棵

已于 2025-03-31 16:27:04 修改

阅读量367

点赞数 7

分类专栏： Python爬虫教程文章标签： beautifulsoup python

于 2024-07-22 14:29:21 首次发布

本文链接：https://blog.csdn.net/WwLK123/article/details/140603009

版权

文章目录

代码
代码解释
控制台输出结果

代码

#-*- coding:utf-8 -*-
from bs4 import BeautifulSoup
import requests, time, json

headers = {
   
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

文理棵

关注关注

7
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

python批量查询豆瓣书籍评分（教程附源码）

for_lazy的博客

02-04

3286

在懒人盘分享的高分电子书是利用python批量查询得到的发现常规的豆瓣api不允许调用了，几番搜索发现一个接口 https://book.douban.com/j/subject_suggest?q=书名利用这个接口可以拿到书籍在豆瓣上的的url 获取单本书籍url的函数 def get_book(title): url = "https://book.douban.com/j/s...

Python爬虫之爬取豆瓣图书TOP250

JinTian312的博客

01-21

8281

爬取豆瓣图书TOP250图书信息及图书海报写这篇主要是为了去图书馆不知道看什么书或者不知道该买些什么书的时候可以参考经过众多豆友们点评出的好书推荐，哈哈哈哈哈。上代码（全部代码均在这里，只是分开按照步骤解释一下）第一步：导入需要用到的包。 from bs4 import BeautifulSoup # 网页解析，获取数据 import urllib.request, urllib.error # 指定url，获取网页数据 import re

参与评论您还未登录，请先登录后发表或查看评论

使用Beautiful Soup和requests爬取豆瓣电影top250

chengstudying的博客

08-13

5040

1. Beautiful Soup 前面介绍了Beautiful Soup的基本使用方法，请参考文章爬虫利器BeautifulSoup之CSS选择器的基本使用和Beautiful Soup之find()和find_all()的基本使用，现在搞个实例来验证一下。就以爬取豆瓣电影信息为例吧。 2. 分析请求链接打开豆瓣电影top250首页信息如下：下滑到最下方，可以看到一共有10页，F12或右键检查每页的具体链接，可以发现如下规律： #第1页： https://movie.douban.com/top2

喜欢看电影来哦！教你如果使用Python网络爬虫爬取豆瓣高分电影！

y4544159的博客

09-30

4649

豆瓣电影评分爬取

weixin_63180938的博客

09-05

2555

对豆瓣网站的简单解析和爬取数据

java课后习题第一次作业

ysh的博客

11-19

876

目录P137-4p138-6P139-11P186-7P187-10P187-11P264-10P265-2P267-5P186-7另一种写法 P137-4 题目：编写一个程序，读取一行句子作为输人，然后显示下面的响应:如果这个句子以问号结尾，并且输人中包含偶数个字符，那么显示单词Yes。如果这个句子以问号结尾，并且输人中包含奇数个字符，那么显示单词No。如果这个子句以感叹号结尾，则显示单词Wow。对于所有其他情况，显示单词 You always say,后面跟着用引号括起来的输人字符串。你的输出应该全部

Python中的爬虫实战：豆瓣图书爬虫

G171104的博客

06-23

1589

我们使用urllib库的Request方法，将请求头和网址封装到一个对象中，然后使用urllib库的urlopen方法，发送网络请求并获取页面，最后使用read和decode方法，将页面内容转换成utf-8格式的字符串。具体而言，我们使用Python中的urllib和beautifulsoup4库，针对豆瓣图书网站的HTML结构，编写了爬取豆瓣图书信息的Python程序，成功实现了数据采集和存储。在每个循环中，我们根据当前页码计算出所需的url，并调用get_html函数，获取HTML页面。

利用python爬虫爬取豆瓣读书-文学-名著的封面

小赵同学的博客

09-29

1583

获取至少两个页面的豆瓣读书—文学—名著的图书封面图片，将图片存到文件夹。具体代码如下： #dubanimage.py import requests from bs4 import BeautifulSoup from urllib.request import unquote def getHTMLText(url): headers={'cookie':'bid=_qmdmSYQXOc; dbcl2="220543507:+d6RaThYFJg"; __utmz=30149280.163

Python爬虫实例：使用requests库和re库爬取某旧书网

Nick的博客

04-11

817

在简单学习和了requests库和正则表达式re库后，尝试使用这两个第三方库完成爬取某旧书网书名价格并打印。但是最终打印结果出现了部分乱序，猜测是正则表达式形式问题。进而在后面学习中，我就感受到了BeautifulSoup库这种解析库和HTMl类的标签语言的好用。 import requests import re #爬取网页数据并解码得到文本 def getHTML(url): tr...

BeautifulSoup爬取豆瓣电影数据

IT小辉同学

06-28

1109

一定要热爱奥！！！

爬虫批量获取电影名称及电影评分

放空90的博客

04-13

5085

前言之前自己接触到一个网站：哈哩哈哩，对没错，就是和B站如此相似。。。这个网站里也有许多的资源，包括很多的电影，动漫等等（似乎有广告之嫌。。。）。但是苦于电影太多，而且很多电影都没有听过，就萌生了一个想法：写一个爬虫，获取部分电影名称，然后再自动去豆瓣获取评分，最后根据评分来看高分电影 1 获取电影名称按照常规操作走的话，第一步就是再chrome中F12查看页面内容，但是不晓得这个网站做...

python豆瓣历史评分_python快速查豆瓣评分

weixin_39940957的博客

12-03

989

当我们听说了一部电影的时候，习惯性地回去豆瓣查它的评分，然后再决定看不看。现在的一些豆瓣爬虫程序，都要爬取很多用不上的信息，而且能够指定影片搜索的也不常见。真正影响我们是否看某个影片的因素，主要只有评分和评论，但评论看多了，难免会被一些差评所影响，甚至剧透，错过一部好片子。所以最客观的因素，还得是豆瓣评分，今天我们就自己写一个非常简易的快速查分程序。在这里，我们用的不是豆瓣的常用url，而是另辟蹊...

python爬虫基础-urllib2附带数据解析