不写一段代码来获取扇贝单词的接口数据
最近想做一个背单词相关的app,要是自己一个个去网站搜然后再复制到数据库中太慢了,所以就考虑能不能通过接口或者python自动将数据爬下来。
第一步,登录并寻找可以爬取的数据(想直接看结论可以到第四步)
首先要先登录去寻找扇贝单词中有显示单词的地方,在我找了一圈,发现在单词学习的词表中(这要先自己提前添加一本词书),只要自己单词还没有开始背,可以在未学单词中来获取本词书的单词数据。
到这未学单词页面,首先就是先查看扇贝单词是通过服务器渲染还是客户端渲染,要是服务器渲染,在源码中就可以直接看到单词的数据,那样就可以直接通过python来进行爬取,要是客户端渲染,那就得考虑通过调用接口来拿取单词数据了。
这里我到源码中去搜索matter这个单词。
结果发现,源码中并没有这个单词的数据,就说明得通过接口的方式来获得数据了。
第二步,对症下药
那此时就是得通过F12的网络检查来进行抓包了。(注意:这里