- 博客(6)
- 收藏
- 关注
原创 针对爬虫和反爬虫的一些内容整理
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、反爬虫是什么?二、爬虫的几种实现方案1.网络请求2.模拟浏览器执行2.反爬虫方案最终的最终前言本文针对目前各种爬虫框架, 包括scrapy, requests, selenium 等, 整理和总结了一些针对其特征进行反爬虫的方法 。一、反爬虫是什么?在这个内容为王的时代, 窃取内容, 成了很多商业模式的致富之道, 为了更好的保护网站上的内容不被窃取, 只能是针对爬虫的技术进行分析研究, 然后针对其特点进行针对性防
2020-12-08 14:38:59 385
原创 抓取京东商品信息
在使用requests进行商品信息抓取的时候, 发现京东的商品信息都是通过js动态加载到页面中的, 这样我们请求到页面源码以后, 就无法获取到对应的价格, 名称和详情等信息, 需要一种类似浏览器能将页面执行完后, 加载js, 在进行网页内容获取的一种方式。 所以就有了 selenium 这个框架, 他可以掉起浏览器, 将页面执行成功后, 在进行获取网页的内容, 优点是, 可以绕过一些动态加载的网页内容, 缺点是效率极低。CollectJD.pyimport requestsfrom selenium
2020-12-06 22:38:30 1496 2
原创 爬虫抓取中关村笑话网站 -- python
先上代码import _threadimport timeimport requestsfrom lxml import etreeheads = {}heads['User-Agent'] = 'Mozilla/5.0 ' \ '(Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 ' \ '(KHTML, like
2020-12-04 00:53:12 423 1
原创 9种Anti方法
学习了一些Anti的资料,把常用的9种整理了出来,vc++的代码。分享给大家代码的结构很简单 就不附上什么说明文档了一种方法对应一个按钮 TLS的添加没有在界面显示出来链接: https://pan.baidu.com/s/1UjUFnua0BmrNX9Qm9JA6BA 提取码: duxp...
2020-11-24 23:07:15 788
原创 A-PDF All to MP3 Converter 2.0.0 (.wav) Buffer Overflow Exploit 分析
【原创】A-PDFAlltoMP3Converter2.0.0(.wav)BufferOverflowExploit分析时间:2011-01-19Exp来源:http://www.exploit-db.com/exploits/16009/看到exploit-db上出来这个漏洞,就分析了一下。入门阶段的文章,高手飘过。先看下exp 1 2 3 4 5 6 7 8 9 10 11 1...
2020-11-24 23:01:43 656
原创 ActFax Server (LPDLPR) Remote Buffer Overflow Exploit分析
标 题: ActFax Server (LPDLPR) Remote Buffer Overflow Exploit分析作 者: 吕勇时 间: 2011-02-21●漏洞来源:http://www.exploit-db.com/exploits/16176/●bug函数定位在004A4B7D下断点,运行程序(F9),调用漏洞利用程序,这时程序断在004A4B7D 这里,看堆栈,找到返回程序领空的返回地址。这里一直往下翻,找栈回溯。要翻很远。才能找到一个堆栈的返回地址。这里我找到在c
2020-11-24 22:54:35 271
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人