之前用php写了一个方法,感觉那个效果不是很好,学了python的正则之后,用写了一个python版的,大概功能差不多,只是,更加清楚了,这只是代码,正在学习pyqt,想写一个客户端
import re
import urllib
#关键字
qword=raw_input('input some word:')
#返回结果的条数,好像得是10的倍数,或者小于10
rn=raw_input('input the number:')
#分析百度参数得到的
url='http://www.baidu.com/s?wd=site:pan.baidu.com+'+qword+'&rn='+rn
html=urllib.urlopen(url).read().decode('utf-8')
#正则表达式
#reg=re.compile(r'<.*?\"c-abstract\".*?m>(.*?)</em>.*?:(.*?)</')
#reg=re.compile(r'data-tools.*?\"title\":"(.*?)_.*?\"url\":"(.*?)"')
reg=re.compile(r'<.*?\"c-abstract\".*?m>(.*?)</em>.*?:(.*?)</.*?data-tools.*?\"title\":"(.*?)_.*?\"url\":"(.*?)"