C#批量爬取网站验证码图片/爬取网页内容(1)

本文介绍如何使用C#批量爬取验证码图片,通过获取验证码链接,创建HTTP请求并根据Content-Type判断保存图片,同时提供了一个简化版的控制台程序示例。涉及的技能包括HTTP请求、文件保存以及对Content-Type的理解。
摘要由CSDN通过智能技术生成

前段时间师姐给了我一个C#爬图的代码,很简单有效吐舌头。我查了点资料,把代码搞懂了然后简化又扩展了一下使它能够爬取网页内容。现在把代码和过程放上来供有兴趣的朋友一起探讨。

这一部分只讲如何爬验证码图片。爬取内容的部分见下一篇博客吧~

1.获取验证码图片链接

有的验证码进入网页就有,有的要在登录界面输入用户名,故意输错几次密码才能把验证码刷出来。

新浪的验证码,如图所示:

然后右击验证码图片,选择在新标签页中打开图片。

新标签页面中只有验证码图片,且每刷新一下页面就会发现验证码也变了。但是这个标签页的链接是不会变的,只是每次刷新都会随机展示一个验证码而已。这个标签页的链接就是我们要找的!!!

复制这个链接,比如新浪的是:https://login.sina.com.cn/cgi/pin.php?r=1523262272227&lang

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值