古诗文网《三国志》爬虫

最新推荐文章于 2024-08-17 19:35:42 发布

weixin_30906185

最新推荐文章于 2024-08-17 19:35:42 发布

阅读量99

点赞数

文章标签：爬虫

原文链接：http://www.cnblogs.com/SKYOFROC/p/3981575.html

版权

模仿自：http://blog.csdn.net/pleasecallmewhy/article/details/8932310

1、新建一个类，为Spider Module，有三个变量 page、pages、enable 分别代表页数、内容、开关

2、开启一个线程，作为后台读取，此线程执行 LoadPage 方法，只要 enable 开关不关，就一直读取，但是读取页数不超过两页，超过两页就 sleep 1秒再判断

3、显示一页，删除一页，一页内容分很多段显示，每次显示一段都要输入一个回车，如果输入quit 就让 enable 关闭，然后退出

要点和问题：

　　LoadPage 中虽然用搜狗浏览器显示古诗文网是 unicode，但是如果不用 decode 转码，会出现乱码

转载于:https://www.cnblogs.com/SKYOFROC/p/3981575.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注