请问下这种链接怎么动态翻页?拿到完整的html?【赠书】

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

孤舟蓑笠翁,独钓寒江雪。

大家好,我是Python进阶者。

一、前言

前几天在Python最强王者交流群【哎呦喂  是豆子~】问了一个Python网络爬虫数据处理的问题。问题如下:

大佬们 请问下这种链接怎么动态翻页?拿到完整的html?

打开链接默认是显示20行数据,要再往下查到数据,需要手动下滑才能获取,这种怎么完整的html? 直接对链接获取只有默认的前20行数据,想要完整的。

2507cee4deafc7f94a0d2b0295ecd115.png

二、实现过程

这里【瑜亮老师】给了一个指导,如下所示:改from msgid=2247485282这里就可以了。当然其实也可以用自动化库下滑网页至底然后获取源码,之后用lxml、bs之类的解析html获取所需的数据。

【哎呦喂  是豆子~】:瑜大佬  这是什么意思呀  不太懂     之前是使用selenium控制自动下滑 但是换到别人电脑上他的运行不了 查了半天不知道问题出哪里

【瑜亮老师】:运行不了是因为webdriver版本和浏览器版本不匹配。现在很少用selenium了。都是用playwright或者DrissionPage

【猫药师Kelly】:DrissionPage +1

【瑜亮老师】:selenium总是会因为webdriver版本和浏览器版本不匹配导致代码无法运行。后期维护成本很高

【哎呦喂  是豆子~】:确实 换个环境就用不了  对我们这些菜鸟不太友好 ,我去看看这个  学习学习  。

【瑜亮老师】:DrissionPage只需要3篇微文就能学会用法

【猫药师Kelly】:B站有详细教学了,上手很简单。

【瑜亮老师】:@哎呦喂  是豆子~ 你会用selenium,那么DrissionPage的用法和它差不多

【黑科技·鼓包】:看了下DrissionPage很方便啊

【哎呦喂  是豆子~】:还真是  刚看完几篇推文  感觉比selenium方便  虽然是还没上手 但是有一种看完有手就会的感觉  哈哈哈。

【瑜亮老师】:其实这个时候你才真正的体会到学习的快感。

顺利地解决了自己的问题。

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

【赠书活动】--留言赠书,私我

本书是一本全面的Python技术及面试指南,旨在帮助读者深入理解Python编程语言的核心概念,并掌握在技术面试中取得成功的关键技巧。全书分为4个部分。

a869c4c946d355a15cbb017a082afe3d.png

第一部分 面试流程。这一部分详细介绍了硅谷公司的面试流程,包括非技术电话面试、技术电话面试(包括闲谈、技术沟通和提问环节)以及现场面试的准备和策略,既为读者提供了面试前的全面准备指导,也帮助读者在面试中展现出良好状态。

第二部分 数据结构。从基础的列表、堆栈、队列、优先队列、字典和集合,到更复杂的链表、二叉树、其他树结构(如前缀树、线段树、二叉索引树)和图的表示与应用,每一章都通过丰富的实例来展示如何巧妙应用这些数据结构。

第三部分 算法。这一部分覆盖了二分搜索、双指针法、动态规划、深度优先搜索、回溯、广度优先搜索、并查集等核心算法。结合面试真题,通过逐步分析,引导读者掌握每种算法的思想及其在解决实际问题中的应用。

第四部分 系统设计。理论知识部分,从设计需求分析到高层构建,然后到具体组件设计,再到扩展设计,帮助读者理解如何构建可扩展、高效的系统架构。实战案例部分,包括分布式缓存系统、网络爬虫系统、TinyURL加密与解密、自动补全功能、新闻动态功能、社交媒体应用和出行应用的设计,涵盖系统设计的关键技术。此外,这一部分涵盖了多线程编程与设计机器学习系统的知识,既帮助读者理解并行处理的概念和应用,又扩展机器学习的重要知识和面试技巧,并提供设计搜索排名系统和推荐系统的实例。

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python网络爬虫的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【哎呦喂  是豆子~】提出的问题,感谢【瑜亮老师】、【猫药师Kelly】、【冯诚】、【黑科技·鼓包】、【冷喵】给出的思路,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

f1939c9e8415d5d1e5d5bfc852df2540.png

大家在学习过程中如果有遇到问题,欢迎随时联系我解决(我的微信:pdcfighting1),应粉丝要求,我创建了一些高质量的Python付费学习交流群和付费接单群,欢迎大家加入我的Python学习交流群和接单群!

3fbeceb73ced5a7790528e5d1f61aee1.png

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

8a4798120c5e5102e6ff17c2511d4975.jpeg

------------------- End -------------------

往期精彩文章推荐:

6e5b9ec4fd5b299bbd053b307bb8f3a2.png

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

  • 6
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值