我的Python入门学习(一):网络刷博器爬虫

最近两天开始学习Python,由于过去主要使用C,对Python的简洁易用感到很新奇,大大增加了学习的兴趣。

从今天开始记录Python的学习历程和笔记。一方面方便自己未来查阅,另一方面与大家共享学习。

简单浏览了一下Python的简单语法后,我上网找了一些资料。在查找的过程中,看到了一个由智普教育制作的Python学习视频,视频有一段名字叫做”网络刷博器爬虫“吸引了我的注意。

网络刷博器爬虫的基本原理:一些博客网站打开某博客,该博客访问量就加一,如果多次循环打开同一博客,该博客的访问量就会大量上升。

程序需要用到第三方函数库模块:httplib2

函数库的下载地址:https://code.google.com/p/httplib2/

使用前需要配置系统环境变量,在系统环境变量Path后添加python安装目录。进入httplib2模块的解压目录,运行settup.py安装即可

打开一个网页的代码为:

webbrowser.open_new_tab('网址')
有于打开一定数量的网页后,内存会增加,我们需要定时关掉浏览器,关掉浏览器的代码如下(关掉Chrome为例):

os.system('taskkill /F /IM chrome.exe')

同时要使用到while循环来循环操作,达到刷博客的目的。具体的代码仿照了智普教育学习视频,感谢智普教育,完整的代码如下:

import webbrowser as web
import time
import os
import random
count = random.randint(5,7)
j=0
while j<=count:
    i=0
    while i<=8 :
        web.open_new_tab('网址')  #网址自己填入
        i=i+1
        time.sleep(0.8)
    else:
        os.system('taskkill /F /IM chrome.exe')
        print j,'time webbrower closed'
    j=j+1
    


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值