基于python简易小说阅读器(一)
实现功能:界面显示小说内容,界面的最下方有按键实现章节切换
后台需要有小说内容的数据,针对这一块,python的爬虫模块requests可以满足项目需求,前端界面比较简单用python自带的界面模块tkinter即可实现。
这里先说一下后台的实现,requests模块的安装这里不再赘述,网上一查就有,推荐安装pip模块以后,使用相应的指令下载。
首先需要下载小说的内容,我们需要得到网页的数据,这里就需要介绍requests模块中的get方法:
关于requuests模块的get方法,最通常的用法是通过r=request.get(url)构造一个向服务器请求资源的url对象。这个对象是Request库内部生成的。这时候的r返回的是一个包含服务器资源的Response对象。包含从服务器返回的所有的相关资源。相当于此时得到的是一个关于网页的操作句柄。上面用法中的url就是网页的网址,比如我们需要向百度发出请求则url的值是https://www.baidu.com
既然得到了操作句柄,那接下来就可以得到网页的基本内容了。这时,就要用到text属性了,这个属性可以得到请求网页的内容,以字符串的方式。这里副上其他属性的说明:
import requests
url = 'http://m.26ksw.cc/book/57659/54059141/2.html'
strHtml = requests.get(url)
html = strHtml.text
print(html)
运行代码可以看到
在字符串输出的网页源码中,内容总是在p标签之中, 考虑到这里的网页源码实际上是一大串字符串,所以,要得到小说内容,只需要把p标签中的字符串截取出来就行了。到这,思路基本清晰了,可以把p标签中的字符串分割出来,存入数组/列表中,然后输出数组/列表,就可以看到完整的内容了。 虽然用python基础的字符串分割函