本来打算用爬虫来爬数据的,但是爬出来的英文内容为
{{content}}
很难受,于是仔细分析了下它页面数据获取展示的方式,居然直接找到了api接口。。。。
词霸每日一句
分析了下词霸的每日一句接口每日一句
页面如下
每天都会显示一句英文和对应的中文。
开始分析
F12查看network会发现很多请求,但是选择只展示js的network,然后点击下面的日期时,发现请求很少。
其中第一条请求就是我们需要的每日一句的api。
把链接copy出来
http://sentence.iciba.com/index.php?callback=jQuery190012654789607849026_1587647616150&c=dailysentence&m=getdetail&title=2020-04-22&_=1587647616178
内容很简洁明了,经过测试发现只要改变日期就可以获取每日一句的数据。
改变日期可以获取到明天的每日一句(文章日期为23号)。
小问题
数据出来了,但是发现返回的数据不是标准的json格式,需要自己把’jquery’到’(‘和数据结尾的’)'等去掉才是正确的json格式。
有些麻烦,所以想着既然试了日期,那么再试下其他的,于是把
callback=jQuery190012654789607849026_1587647616150
这个参数去掉了,发现还可以获取到数据,并且就是json格式,不需要再处理。所以又试了下发现也可以去掉
&_=1587647616178
完整的api
所以最后的访问地址为
http://sentence.iciba.com/index.php?c=dailysentence&m=getdetail&title=2020-04-24