小白爬虫

最新推荐文章于 2023-05-15 10:10:14 发布

「已注销」

最新推荐文章于 2023-05-15 10:10:14 发布

阅读量261

点赞数

分类专栏： Python 文章标签： python sprid

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38334710/article/details/79681185

版权

Python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

前计

最近在完成老师布置的任务看了许多关于Python的知识，但是因为研究的是图像识别的知识，这个任务对于我这个不是数学专业的本科生，有点略显吃力，但是也在硬着头皮去努力的学习。期间学习了Python的语法知识，然后再休息的时候就去做了一个爬虫。深刻感受到了Python的神奇与强大啊。

正题

好了废话不多说了，现在就开始我们的正题·
首先看一下，我们要爬去的网站吧。一个关于小说的网站选择这个网站的主要原因是因为他是一个静态的网站(主要是自己刚开始学习，对于一些比较复杂的网站还没那个能力)。

分析

这个网站
首先我们要去找到突破口，突破口有许多，我选择的这个网站的导航页面就是这个“玄幻魔法”“武侠修真”。。。。点击不同的标签对应这个不同的小说。点击一个标签栏进去看看~

又是一层。。。
继续点击。。

继续点击（看个小说还真是不容易啊。）

我去还有啊我还点~！！！

好吧终于看到小说了。。。
说下思路吧，我的思路很简单就是去每个标签栏去找到小说，然后尽到小说里面去找到各个章节，然后去将每个章节的文字爬下来就好了。

开始撸代码

首先

import requests
import re
import pymysql

解释一波，这个requests就是一个Python的网络请求的框架
re就是Python的正则表达式框架，然后就是pymysql就是用来接连mysql数据库的。

代码很简单，上网一搜需要的就都有了，用到了requests请求，re正则匹配，然后就是将趴下的数据，存入到mysql里面，代码很基本（我写不出来高深的）。然后我等一下将代码传到github上。
github地址

后记

下一步的打算就是让池哥帮我做一个前台的界面，我提供后台和数据做一个简短的小说网站。纯属娱乐。好了好了，飞哥催我洗澡了，溜啦溜啦~ 让我的小爬虫去疯狂下吧~

「已注销」

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
小白爬虫

前计最近在完成老师布置的任务看了许多关于Python的知识，但是因为研究的是图像识别的知识，这个任务对于我这个不是数学专业的本科生，有点略显吃力，但是也在硬着头皮去努力的学习。期间学习了Python的语法知识，然后再休息的时候就去做了一个爬虫。深刻感受到了Python的神奇与强大啊。正题好了废话不多说了，现在就开始我们的正题· 首先看一下，我们要爬去的网站吧。一个关于小说的网站...
复制链接

扫一扫

专栏目录

「已注销」 CSDN认证博客专家 CSDN认证企业博客

码龄7年

9: 原创

-: 周排名

-: 总排名

2819: 访问

: 等级

121: 积分

4: 粉丝

6: 获赞

6: 评论

0: 收藏

私信

关注

分类专栏

最新评论

Firebase 调研
「已注销」: 能到是能但是你们公司那个体量应该是有自己的一套吧
Firebase 调研
「已注销」: 图片显示不了实际就是通过scheme或者预编译指令进行下区分
Firebase 调研
WgRui: 有用
Firebase 调研
芳心收割机: 这个东西公司级项目能用么
关于ios深浅拷贝
「已注销」回复抵制脱发你我有责: 小白。。。向大佬学习

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。