自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 针对爬虫和反爬虫的一些内容整理

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、反爬虫是什么?二、爬虫的几种实现方案1.网络请求2.模拟浏览器执行2.反爬虫方案最终的最终前言本文针对目前各种爬虫框架, 包括scrapy, requests, selenium 等, 整理和总结了一些针对其特征进行反爬虫的方法 。一、反爬虫是什么?在这个内容为王的时代, 窃取内容, 成了很多商业模式的致富之道, 为了更好的保护网站上的内容不被窃取, 只能是针对爬虫的技术进行分析研究, 然后针对其特点进行针对性防

2020-12-08 14:38:59 385

原创 抓取京东商品信息

在使用requests进行商品信息抓取的时候, 发现京东的商品信息都是通过js动态加载到页面中的, 这样我们请求到页面源码以后, 就无法获取到对应的价格, 名称和详情等信息, 需要一种类似浏览器能将页面执行完后, 加载js, 在进行网页内容获取的一种方式。 所以就有了 selenium 这个框架, 他可以掉起浏览器, 将页面执行成功后, 在进行获取网页的内容, 优点是, 可以绕过一些动态加载的网页内容, 缺点是效率极低。CollectJD.pyimport requestsfrom selenium

2020-12-06 22:38:30 1496 2

原创 爬虫抓取中关村笑话网站 -- python

先上代码import _threadimport timeimport requestsfrom lxml import etreeheads = {}heads['User-Agent'] = 'Mozilla/5.0 ' \ '(Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 ' \ '(KHTML, like

2020-12-04 00:53:12 423 1

原创 9种Anti方法

学习了一些Anti的资料,把常用的9种整理了出来,vc++的代码。分享给大家代码的结构很简单 就不附上什么说明文档了一种方法对应一个按钮 TLS的添加没有在界面显示出来链接: https://pan.baidu.com/s/1UjUFnua0BmrNX9Qm9JA6BA 提取码: duxp...

2020-11-24 23:07:15 788

原创 A-PDF All to MP3 Converter 2.0.0 (.wav) Buffer Overflow Exploit 分析

【原创】A-PDFAlltoMP3Converter2.0.0(.wav)BufferOverflowExploit分析时间:2011-01-19Exp来源:http://www.exploit-db.com/exploits/16009/看到exploit-db上出来这个漏洞,就分析了一下。入门阶段的文章,高手飘过。先看下exp 1 2 3 4 5 6 7 8 9 10 11 1...

2020-11-24 23:01:43 656

原创 ActFax Server (LPDLPR) Remote Buffer Overflow Exploit分析

标 题: ActFax Server (LPDLPR) Remote Buffer Overflow Exploit分析作 者: 吕勇时 间: 2011-02-21●漏洞来源:http://www.exploit-db.com/exploits/16176/●bug函数定位在004A4B7D下断点,运行程序(F9),调用漏洞利用程序,这时程序断在004A4B7D 这里,看堆栈,找到返回程序领空的返回地址。这里一直往下翻,找栈回溯。要翻很远。才能找到一个堆栈的返回地址。这里我找到在c

2020-11-24 22:54:35 271

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除