反扒百度收录信息

现在管理的网站有15000篇文章,大部分已被百度收录(输入网址后可以查看百度是否收录)。本人想做一个小程序实现一个文章收录情况的统计;看一下那篇文章是否被收录,那些没有被收录;如果手工的方法来完成这样一个工作的话不太人性化所以想用程序来实现这一功能。

查了许多的网上资料,但大多数人的代码不加任何测试的转载.本人测试时大多是有错误的.本来对这样的程序就不理解又遇上多次错误;以为方向不对?后来看到了 csdn xiaofeng上一篇文章豁然开朗令我坚定了信心用webbrowser 是可以完成这样的任务的。

实现过程只做一下简单的介绍由于软件没有编写完成所以源代码就先不公开,软件测试没问题后会给大家报告一下,并公布源代码.

1.遍历文件夹下所的子文件夹及文件放入StringCollection(静态化的网页在一个文件夹下;本来想放入数据库了手头上没有好的连接类就用这个了)

2. 格式化StringCollection完成对地址路径的组合(由于系统的地址成网址是不一样)

3.搜索代理服务器地址,并验证可用性(因为百度上查询几百次后会有验证码所以要用代理可以大量查询)

4.变换不同的代理地址完成对地址在百度的查询

该小软件适用于科汛的CMS(因为科汛的静态化文件在一个文件夹中)

[@more@]

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/13380151/viewspace-1023817/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/13380151/viewspace-1023817/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值