Hello Python!
#coding:utf8
import urllib2
import re
def getProxy(page):
    url = "http://www.cnproxy.com/proxy%d.html" % page
    re_qb = re.compile(r'<tr><td>(.*?)<SCRIPT type=text/javascript>document\.write.*?</SCRIPT></td><td>(.*?)</td><td>(.*?)</td><td>(.*?)</td></tr>')
    html = urllib2.urlopen(url).read()
    my_qiubai = re_qb.findall(html)
    for i in range(0,100):
        print "-" * 50
        print my_qiubai[i][0], my_qiubai[i][1], my_qiubai[i][2], my_qiubai[i][3]
            
for x in range(1,11):
    getPage(x)

阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/heyzol/article/details/17111759
个人分类: Python
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

不良信息举报

Hello Python!

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭