本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
以下文章来源于腾讯云 作者:Python进击者
( 想要学习Python?Python学习交流群:1039649593,满足你的需求,资料都已经上传群文件流,可以自行下载!还有海量最新2020python学习资料。 )
XX文库分析
PPT
首先我们来分析一下PPT的下载,其实对于这种数据一般都是采用抓包的思路来进行的。
我一个一个找了一下,发现上面的数据包中有我们想要的数据,我们看下拿到了什么数据:
我们看到了有一个参数为20。恰好,我们想要下载的PPT也是20页,于是访问一下zoom中的链接。
正是我们要的,所以后面你懂得,就交给帅气牛逼的你了!
随意找了个word文档,同样的思路,我们还是来抓包,当然这个包跟我们之前的肯定不同。
同样查看这个包,看看这个包给了我们什么数据:
可以看到这就是word当中的文字信息,当然有些小伙伴说为啥你这不只是拿到文字信息么?确实这样只能拿到文字信息,但是在这串数据里面有相应的位置坐标信息。帅气牛逼的你们可以自己取折腾折腾!
txt
关于txt就有点小麻烦了,首先我们需要获取该txt文档的id名称
然后我们直接进行url的搜索
搜索关键词,975114ef19e8b8f67c1cb9d9是我的文件id,自己修改
wkretype.bdimg.com/retype/text/975114ef19e8b8f67c1cb9d9
我们双击筛选出来的包:
你可能一脸懵逼,但是我们去转换一下字符编码:
可以看到正是我们需要的数据。后面的大家就自己解决啦!