python爬虫爬保研论坛

最新推荐文章于 2020-05-18 11:40:22 发布

VIP文章 ppnn13

最新推荐文章于 2020-05-18 11:40:22 发布

阅读量1k

点赞数

分类专栏： python学习文章标签： python 爬虫正则论坛

本文链接：https://blog.csdn.net/ppnn13/article/details/16114691

版权

 
 
 
  
  
  #EE论坛爬虫
 
 
 
#by JerryFang
#2013.11.13

import re
import urllib2
import urllib
import cookielib

def visitpage(url):
    nr = urllib2.urlopen(url).read().decode('gbk')
    print nr
    z = re.compile('''<a href=.*?class="xi2">(.*?)</a>
''', re.S|re.MULTILINE)
    t = re.compile('''<em id=".*?">(.*?)</em>
''', re.S|re.MULTILINE)
    c = re.compile(ur'''<table.*?>(.*?)</table>

''', re.DOTALL|re.MULTILINE)

##    author = z.findall(nr)
##    time = t.findall(nr)
    cont = c.findall(nr)

##    print author
##    print time
    print cont
    raw_input('press any key')

loginurl =

最低0.47元/天解锁文章

优惠劵

ppnn13

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫爬保研论坛

#EE论坛爬虫#by JerryFang#2013.11.13import reimport urllib2import urllibimport cookielibdef visitpage(url): nr = urllib2.urlopen(url).read().decode('gbk') print nr z =
复制链接

扫一扫