本篇主要分享一下之前提到的漫画APP中数据拉取的技术实现
在开始之前,我们需要明确两点:我们的漫画数据从哪来?利用什么工具获取这些数据?
对于第一点,由于我们大部分人可能都没有能直接获取漫画原稿链接的接口,所以只能从现有的一些服务站点爬取数据。这其中我们最常用,就是从现有网站获取数据来源。而这里我们也是主要介绍这种方式
不过首先要注意的是,这里我们要实现的不是把某个特定网站的数据爬取下来,然后存储到本地或服务器上,而是实现我们什么时候需要这些数据,就什么时候实时拉取,不借助也不需要借助任何本地存储或云端服务。
首先就是找网站了。
国内比较出名动漫站点大概就是腾讯动漫这些大厂的网站了吧,不过如果你想在腾讯动漫这些网站上拉取数据,比起一些其它的普通漫画网站要麻烦一些,因为腾讯动漫这些网站会涉及到id验证才能读取到数据,更重要的是,如果那个网站的漫画是需要收费的,那我们暂时也是无法获取它的数据的。毕竟在这之前,你还需要先通过它的收费验证,之后它才会向后端请求漫画数据。
这里就以一个数据相对容易拉取的网站为例(其它网站大同小异,按个人需求来定)如下图:
这里以“漫画台”这个网站为例,我们可以看到,这个网站的首页,大概就分成了两部分:一个是顶部导航栏,一个是漫画简介。这两个部分都很重要,在它的源码中就隐藏着我们所需要的重要东西:漫画数据以及分类数据
这时候我们可以按下键盘的F12键(或者找到“开发者工具”),可以看到当前网页的源码: