关于新浪博客内容的抓取,weibo.com/ssclhb 这里面没有上一页和下一页怎么处理?

     各位大神们好,我想完全的获取新浪博客里面的内容。网页如下:

新浪提供了一个HTTPS格式,用于电脑访问。https://www.weibo.com/ssclhb

另一个是HTTP格式,用于手机访问。https://weibo.cn/ssclhb

手机端的由于有上一页和下一页还好程序控制。对于没有上一页和下一页的,只有用滚轮到底才继续加载的,你们怎么处理?

还有,近期分析一个站的时候发现,里面的源码只有20十行,但是介绍和图片等全看不到。只有用检查才可以看到真正的源码,这种数据怎么获取?

我个人比较熟悉C#,望大神指点。

如果能有范例,那更是求之不得。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值