现在管理的网站有15000篇文章,大部分已被百度收录(输入网址后可以查看百度是否收录)。本人想做一个小程序实现一个文章收录情况的统计;看一下那篇文章是否被收录,那些没有被收录;如果手工的方法来完成这样一个工作的话不太人性化所以想用程序来实现这一功能。
查了许多的网上资料,但大多数人的代码不加任何测试的转载.本人测试时大多是有错误的.本来对这样的程序就不理解又遇上多次错误;以为方向不对?后来看到了 csdn xiaofeng上一篇文章豁然开朗令我坚定了信心用webbrowser 是可以完成这样的任务的。
实现过程只做一下简单的介绍由于软件没有编写完成所以源代码就先不公开,软件测试没问题后会给大家报告一下,并公布源代码.
1.遍历文件夹下所的子文件夹及文件放入StringCollection(静态化的网页在一个文件夹下;本来想放入数据库了手头上没有好的连接类就用这个了)
2. 格式化StringCollection完成对地址路径的组合(由于系统的地址成网址是不一样)
3.搜索代理服务器地址,并验证可用性(因为百度上查询几百次后会有验证码所以要用代理可以大量查询)
4.变换不同的代理地址完成对地址在百度的查询
该小软件适用于科汛的CMS(因为科汛的静态化文件在一个文件夹中)
[@more@]来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/13380151/viewspace-1023817/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/13380151/viewspace-1023817/