获取某程酒店数据

本文介绍了如何爬取某程酒店数据,重点在于解决动态加载的testab参数问题。通过分析JS代码,发现参数由混淆的jsvmp数组生成。为简化复杂性,选择直接进行自动化获取。文章提供了本地构造代码读取数据的方法,并讨论了静态分析的优势。最终实现了自动登录并获取3页酒店数据,每个条目可通过酒店ID进入详情页获取更多信息。
摘要由CSDN通过智能技术生成

本文仅用于学习,切勿用于商业用途,出现任何问题后果自负!!!

这个网站的难点在于testab参数
在这里插入图片描述
通过全局搜索testab
在这里插入图片描述
点击框选的那个js,在如图位置打算断点,可以发现,testab是e()函数得到,然后通过encodeURIComponent编码得到
在这里插入图片描述
在这里插入图片描述
然后往下拉动,成功断住,点进去,然后发现是经过高度混淆的,文末是一个大数组,是一个经过混淆和平坦流的jsvmp
在这里插入图片描述
在这里插入图片描述
由于此种难度极高,需要还原算法,本人能力有限,我们直接走自动化获取
URL:aHR0cHM6Ly9ob3R{liangge}lbHMuY3RyaXAuY29tLw==
目标​URL:aHR0cHM6Ly9ob3Rlb{liangge}HMuY3RyaXAuY29tL2hvdGVscy9saXN0P2NvdW50cnlJZD0xJmNpdHk9MSZjaGVja2luPTIwMjIvMDYvMDUmY2hlY2tvdXQ9MjAyMi8wNi{liangge}8wNiZvcHRpb25JZD0xJm9wdGlvblR5cGU9Q2l0eSZkaXJlY3RTZWFyY2g9MCZkaXNwbGF5PSVFNSU4QyU5NyVFNCVCQSVBQyUyQyUyM{liangge}CVFNCVCOCVBRCVFNSU5QiVCRCZjcm49MSZhZHVsdD0xJmNoaWxkcmVuPTAmc2VhcmNoQm94QXJnPXQmdHJhdmVsUHVycG9zZT0wJmN0bV9yZWY9aXhfc2JfZGwmZG9tZXN0aWM9MSY

通过保存一页网页源码,本地本地构造代码书写好
在这里插入图片描述
读取本地​数据:

def get_data(html):
    """--------------------------------获取数据----------------------------------"""
    element = etree.HTML(html)
    li_el = element.xpath('//*[@id="ibu_hotel_container"]/div/section/div[2]/ul/li')
    results = 
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_44902227

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值