前面,我们介绍了 python实战项目,获取指定网站关键词百度排名,为seo提供参考资料,那为了满足自己的虚荣心,而且听说点击可以提升网站关键词的排名。不过模拟点击,欺骗搜索引擎肯定知道咱们的 IP 了,且不说有没有提升排名的效果,如果欺骗搜索引擎发现某一个 IP 一直在重复的点击自己的网站,肯定把网站按照作弊处理了,反而起到反作用。所以,咱们python模拟点击应该使用代理,以欺骗欺骗搜索引擎。
python 怎样模拟点击网站
python 模拟点击网站,其实咱们前面已经说了很多了,就是请求一次网站内容。咱们以python模拟点击我的博客 https://www.xrkzn.cn为例,代码其实可以很简单:
在我的博客后台,看到了访问记录:
我们还能直接看出,是通过 python-requests 访问的,对于python模拟点击网站来说,这个信息不应该出现,解决办法就是加上 headers 信息,咱们直接上代码:
这个时候,访客记录变成了:
完美了吗?肯定没,假设咱们从百度搜索访问的,应该有来源信息。咱们把它加上:
python获取代理IP
途径总体可以分为两类:免费和收费。我一直用的是免费方式:从一些公开代理 IP 的网站爬取。我以为收费的会更好用,更方便,于是花了钱买了xx代理,结果发现被坑了。。。下面介绍从免费代理网站 python获取代理IP 吧。咱们直接上代码:
输出如下图:
这样,我们就获得了很多代理 IP。
python 找出可用代理 IP
上面利用 python 从免费网站获取到很多代理IP,但是有很多都是不能用的,所以再使用之前,要再写个程序判断某个代理 IP 是否可用,方法如下:
咱们使用代理访问 http://2017.ip138.com/ic.asp,如果能够正确显示 IP,就认为该 IP 是可用的
代码可以如下写:
运行,输出如下:
这样,我们就从一堆不可用的代理中,挑选出了可用的代理,可用于 python模拟点击网站。