基于python简易小说阅读器（一）

追逐距离

已于 2022-07-09 21:43:16 修改

阅读量1.3k

点赞数 1

文章标签： python 爬虫

于 2022-06-29 23:46:37 首次发布

本文链接：https://blog.csdn.net/sjkla/article/details/125354314

版权

基于python简易小说阅读器（一）

实现功能：界面显示小说内容，界面的最下方有按键实现章节切换
Alt
后台需要有小说内容的数据，针对这一块，python的爬虫模块requests可以满足项目需求，前端界面比较简单用python自带的界面模块tkinter即可实现。
这里先说一下后台的实现，requests模块的安装这里不再赘述，网上一查就有，推荐安装pip模块以后，使用相应的指令下载。
首先需要下载小说的内容，我们需要得到网页的数据，这里就需要介绍requests模块中的get方法：
关于requuests模块的get方法，最通常的用法是通过r=request.get（url）构造一个向服务器请求资源的url对象。这个对象是Request库内部生成的。这时候的r返回的是一个包含服务器资源的Response对象。包含从服务器返回的所有的相关资源。相当于此时得到的是一个关于网页的操作句柄。上面用法中的url就是网页的网址，比如我们需要向百度发出请求则url的值是https://www.baidu.com
既然得到了操作句柄，那接下来就可以得到网页的基本内容了。这时，就要用到text属性了，这个属性可以得到请求网页的内容，以字符串的方式。这里副上其他属性的说明：
Alt

import requests  
url = 'http://m.26ksw.cc/book/57659/54059141/2.html'
strHtml = requests.get(url)
html = strHtml.text
print(html)

运行代码可以看到
Alt
在字符串输出的网页源码中，内容总是在p标签之中， 考虑到这里的网页源码实际上是一大串字符串，所以，要得到小说内容，只需要把p标签中的字符串截取出来就行了。到这，思路基本清晰了，可以把p标签中的字符串分割出来，存入数组/列表中，然后输出数组/列表，就可以看到完整的内容了。 虽然用python基础的字符串分割函