![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫# 逆向
学习爬虫过程中遇到的各种问题,记录在此
咔咔胡说
每天努力,每天快乐!
展开
-
nodeJS逆向环境问题
window.btoa()Buffer.from("加密数据").toString('base64')原创 2022-09-02 09:23:03 · 1064 阅读 · 0 评论 -
Python爬虫 懒加载页面
在爬取图片网站时发现浏览器上显示的源码和使用python爬取的源码不同,这里指html页面。网上给的解释是网站使用了懒加载模式,意识是说页面在浏览器加载的时候不会全部加载,而是等用户向下滑动或者页面显示在屏幕范围内时才会加载,这样的好处是减小服务器压力,缩短页面响应时间。在python中爬取的代码却是这个样子,没有src属性,只有data-original属性,推测页面在视口区域加载时通过js将src属性添加到img中,并且将data-original的值赋给src。原创 2023-03-04 21:01:29 · 969 阅读 · 0 评论