python基础教程第二版电子书,python课本第二版答案

yang0728y

于 2023-12-26 05:40:28 发布

阅读量822

点赞数 27

文章标签： java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yang0728y/article/details/135212380

版权

大家好，小编为大家解答python第二版和第三版的区别的问题。很多人还不知道python基础教程第二版电子书，现在让我们一起来看看吧！

在这个全民抗疫的日子，中小学生们也开启了居家上网课的生活。很多没借到书的孩子，不得不在网上看电子课本，有的电子课本是老师发的网络链接，每次打开网页去看，既费流量，也不方便python自学行吗。今天我们就利用python的爬虫功能，把网络链接的课本爬下来，再做成PDF格式的本地文件，让孩子们随时都能看。本文案例爬取的网络课本见下图：

图1 电子课本首页

实现思路为两部分：

一、用python从网站爬取全部课本图片；

二、将图片合并生成PDF格式文件。

具体过程：

一、爬取课本图片

爬虫4流程：发出请求——获得网页——解析内容——保存内容。

根据上篇python批量爬取网络图片里讲过的知识，网页里的图片有单独的网址，爬取图片时需要先爬取出图片网址，再根据图片网址爬取图片。

1、发出请求：

首先找出合适的网址URL，因是静态网页网址，我们可直接用浏览器地址栏的网址，下图2中红框位置即为要用的网址，复制下来就行。

图2 浏览器地址栏网址可用于发出请求

网页网址为：http://www.shuxue9.com/beishida/cz8x/ebook/1.html

2、发出请求获得响应：

url = http://www.shuxue9.com/beishida/cz8x/ebook/1.html

response = requests.get(url)

3、解析响应获得网页内容：

soup = BeautifulSoup(response.content, 'lxml')

4、解析网页内容，获得图片网址：

jgp_url = soup.find('div', class_="center").find('a').find('img')['src']

5、向图片网址发出访问请求，并获得图片(因为该网址仅有图片，不需用find解析)：

jpg = requests.get(jgp_url).content

6、保存图片：

f = open(set_path() + number + '.jpg','wb')

f.write(jpg)

其中，set_path()是提前建好的用于存放图片的路径，代码见下，也可直接写上想用的路径：

def set_path():

path = r'e:/python/book'

if not os.path.isdir(path):

os.makedirs(path)

paths = path+'/'

return(paths)

7、存在问题：

以上就完成了课本图片的爬取，我们打开文件夹，发现只有一张图片被下载了，后面的都没。这是因为浏览网页时，每个页面都有不同的网址，我们试着分析一下，发现电子课本的每一页网址很有规律：

第1页网址：http://www.shuxue9.com/beishida/cz8x/ebook/1.html

第2页网址：http://www.shuxue9.com/beishida/cz8x/ebook/2.html

......

第n页网址：http://www.shuxue9.com/beishida/cz8x/ebook/n.html

每页上的图片网址各不相同，没规律。我们可以根据规律用循环方式，对网址发起访问，获得图片后，自动循环访问下一个网址......最终获得全部图片。

8、设置循环提取：

在以上全部过程纳入到一个for循环里，根据网页，我们可以看到共有152页，设置循环后完整代码为：

import requests , os

from bs4 import BeautifulSoup

for i in range(1, 153):

# 发出请求

url = "http://www.shuxue9.com/beishida/cz8x/ebook/{}".format(i)+".html"

response = requests.get(url)

# 获得网页

soup = BeautifulSoup(response.content, 'lxml')

# 解析网页得到图片网址

jgp_url = soup.find('div', class_="center").find('a').find('img')['src']

# 发出请求解析获得图片

jpg = requests.get(jgp_url).content

# 设置图片保存路径

p = r'e:/python-book'

if not os.path.isdir(p):

os.makedirs(p)

# 保存图片

f = open(p + '/' + str(i) + '.jpg', 'wb')

f.write(jpg)

print("下载完成")

运行程序，即可一次下载全部课本图片，效果为：

图3 运行程序下载图片

图4 下载好的图片

二、将图片合并生成PDF格式文件

图片下载完成后，将图片生成PDF格式才方便使用。网上有专门的软件，但免费的试用版只能合并几张图片。今天教大家一个免费且常用的OFFICE—ppt软件来将多张图片合并成一个PDF格式文件。

新建一个PowerPoint空白文件，点击插入——相册——新建相册，

在弹出的窗体里，点击左上角的“文件/磁盘”，将刚才下载的图片全部导入进去，导入后的效果如下图右侧红框样式，然后点击“创建”，保存文件时另存为PDF格式即可。

总结：

至此，从网页爬取电子课本图片，生成PDF格式的本地文件就全部完成了。其中，如何找到并提取网页中的图片网址，在本头条上一篇文章里已有详述，有疑问的可查阅或留言交流。

另分享一个从网页内容中找到图片网址的简便方法：在打开的开发者工具界面，点击左上角的箭头符号，然后在网页上点击想要查找网址的图片，会自动高亮显示图片网址所在位置。如下所示：

yang0728y CSDN认证博客专家 CSDN认证企业博客

码龄1年

753: 原创

38万+: 周排名

103万+: 总排名

73万+: 访问

: 等级

2万+: 积分

9027: 粉丝

1万+: 获赞

15: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

如何用python爬取天气预报,python爬虫爬取天气数据
2401_88886149: 为什么（div，{<！-->}不能跑
如何用python爬取天气预报,python爬虫爬取天气数据
litangwang1145: temp.append(i['od24']) # 添加当前时刻风力方向 temp.append(i['od25']) # 添加当前时刻风级 temp.append(i['od26']) # 添加当前时刻降水量 temp.append(i['od27']) # 添加当前时刻相对湿度 temp.append(i['od28']) # 添加当前时刻控制质量 #print(temp) final_day.append(temp) count = count +1 # 下面爬取7天的数据 ul = data.find('ul') # 找到所有的ul标签 li = ul.find_all('li') # 找到左右的li标签 i = 0 # 控制爬取的天数 for day in li: # 遍历找到的每一个li if i < 7 and i >0: temp = [] # 临时存放每天的数据 date = day.find('h1').string # 得到日期 date = date[0:date.index('日')] # 取出日期号 temp.append(date) inf = day.find_all('p') # 找出li下面的p标签,提取第一个p标签的值，即天气 temp.append(inf[0].string) tem_low = inf[1].find('i').string # 找到最低气温 if inf[1].find('span') is None: # 天气预报可能没有最高气温 tem_high = None else: tem_high = inf[1].find('span').string # 找到最高气温 temp.append(tem_low[:-1]) if tem_hig
如何用python爬取天气预报,python爬虫爬取天气数据
litangwang1145: import requests from bs4 import BeautifulSoup import csv import json def getHTMLtext(url): """请求获得网页内容""" try: r = requests.get(url, timeout = 30) r.raise_for_status() r.encoding = r.apparent_encoding print("成功访问") return r.text except: print("访问错误") return" " def get_content(html): """处理得到有用信息保存数据文件""" final = [] # 初始化一个列表保存数据('div', {'id': '7d'} ) bs = BeautifulSoup(html, "html.parser") # 创建BeautifulSoup对象 body = bs.body data = body.find('div',{'id':'7d'}) # 找到div标签且id = 7d # 下面爬取当天的数据 data2 = body.find_all('div',{'class':'left-div'}) text = data2[2].find('script').string text = text[text.index('=')+1 :-2] # 移除改var data=将其变为json数据 jd = json.loads(text) dayone = jd['od']['od2'] # 找到当天的数据 final_day = [] # 存放当天的数据 count = 0 for i in dayone: temp = [] if count <=23: temp.append(i['od21']) # 添加时间 temp.append(i['od22']) # 添加当前时刻温
python将excel表数据可视化,python对excel数据可视化
ᦔꫀꪑꪮꪀ玖¹³¹⁴: 【20230126】
python用于数据分析的案例,python数据分析案例教程
Holly的红酒人生: 亲，数据集能分享一下吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。