一个简单的Python爬虫（带详细步骤）

最新推荐文章于 2024-05-27 13:16:19 发布

cxy0_0c

最新推荐文章于 2024-05-27 13:16:19 发布

阅读量1.3k

点赞数 1

分类专栏： Python学习文章标签： Python 爬虫简单小程序豆瓣读书

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cxy0_0c/article/details/86003209

版权

Python学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

大三Python选修课时的期末作品，一个简单的Python爬虫小程序，以下记录其源码，思路及运行结果

该作品运用基础Python知识语法进行爬虫程序构建，使用普通途径下载的Python（3.6版本）的IDLE写代码，用到的库有requests库与BeautifulSoup4库，目的是在输入想要查询的图书类型后反馈豆瓣网图书分区相应类型图书书名。

库的安装在文章最后提及。

简单来说，输入一种书的类型，得到豆瓣网内该类型一堆书的书名

简单记录，如有建议，欢迎留言指教！

源码如下：

#输入图书类型抓取豆瓣检索出的图书名称

#https://book.douban.com/tag/%E7%BC%96%E7%A8%8B

import requests

from bs4 import BeautifulSoup

#抓取页面（使用爬虫通用结构代码）

search_style=input('请输入你要查的图书类型（如：通信/编程）：')

url0='https://book.douban.com/tag/'

try:

url=url0+search_style

#url='https://book.douban.com/tag/经济学'#测试用url

print('正在抓取',url)

print('-------------------------------------------------------------------')

r=requests.get(url,timeout=30)

r.encoding=r.apparent_encoding

r.raise_for_status()

content=r.text

soup=BeautifulSoup(content,'html.parser')

except:

print('抓取失败，请重试！')

#有用信息输出格式调整及打印

taglist1=[]

taglist2 = soup.select('h2 a')

for t2 in taglist2:

taglist1.append(t2.text)

for t1 in taglist1:

print('《',t1.strip().replace('\n','').replace(' ',''),'》')

print('-------------------------------------------------------------------')

设计思路如下：

查看网页源码，分析标签内容

运行结果图：

库的安装：

1、右键安装的Python下的IDLE程序，选择打开文件所在位置

2、右键IDLE，再次打开文件所在位置

3、打开如上图所示中的Scripts文件夹，并复制其路径，如本图中的“F:\Python\Scripts”

4、使用“Win+R”快捷键并输入“cmd”打开计算机命令窗口,并一条一条输如下代码（此过程需连网）

cd F:\Python\Scripts

pip install requests

pip install BeautifulSoup4

（本人这里已经安装，故而提示已经安装，第一次安装时应有进度条）

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
一个简单的Python爬虫（带详细步骤）

大三Python选修课时的期末作品，一个简单的Python爬虫小程序，以下记录其源码，思路及运行结果该作品运用基础Python知识语法进行爬虫程序构建，使用普通途径下载的Python（3.6版本）的IDLE写代码，用到的库有requests库与BeautifulSoup4库，目的是在输入想要查询的图书类型后反馈豆瓣网图书分区相应类型图书书名。库的安装在文章最后提及。简单来说，输入一种书...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。