中国曲谱网爬虫研究(Python)

注:本文为个人学习探索历程

如果直接对该链接(甲骨文“获”之写意笛子谱/洞箫谱(为F调箫而作)_器乐乐谱_中国曲谱网 (qupu123.com))发起请求,得到的数据里只有一张图片的链接(其他几张的链接都用的第一张的代替的),因为剩下的都是异步加载再重新安排上去的(老奸巨猾手段)

首先我是去从异步请求中找包含加载图片的请求,果不其然被我找到了,然后开始分析链接的参数,但这个参数我没有在一开始得到的数据中找到,不用猜是加密了

 

 所以我开始顺藤摸瓜的去找发起该请求的发起程序,顺利的找到了加密部分的js,然后保存到本地开始解密,一般来说解密出相关加密手段后用python代替这一过程就差不多好了(或者用node.js搭配python那样也可以)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值