寻找壹心理网站内置目录源代码

寻找壹心理网站内置目录源代码

以前爬壹心理咨询师资料的时候,用到的是普通的url。翻页的时候url是会改变的,这里举觅健的例子。

在爬觅健肺癌圈子里的贴子的时候,它的每一页都有对应的url,比如圈子第三页的url是http://www.mijian360.com/circle/detail/domain/fa/p/3.html
第四页的url是
http://www.mijian360.com/circle/detail/domain/fa/p/4.html
那么在爬取帖子的时候,只需要改变url中的数字就可以实现翻页的功能。

原来壹心理咨询师页面的形式跟觅健是一样的。然而前几天我在重新爬壹心理的时候发现壹心理的网页源代码全部翻了个新。现在壹心理咨询师的url是https://www.xinli001.com/consult

现在壹心理的网页无论怎么翻页,url都是不变的。而且在查询网页源代码的时候,会发现源代码只写入了第一页咨询师的信息,也就是说网页源代码不是完整的,目录的信息被藏起来了。

下图是网页源代码的目录部分,源代码只显示了前5页的目录页数,实际上这个网址的目录有32页。
Alt
针对这样的情况,在查

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值