今天想下载个资源发现没有积分了,做了个任务,任务要求:点击【执行任务】,跳转至CSDN JOB最懂程序员的招聘会首页:http://job.csdn.net/event/zpweb/index.html 2.数一数共有“多少家”企业负责人的名字是“两个字”的(例如甘泉、邹达)3.返回任务页面,点击【领取奖励】4.将数字填写至横线处。
根据这个任务需求发现可以写个小脚本来实现,也是想练习一下代码,老也不写代码,写了几行python 脚本都调了半天,利用这个机会顺便又温习了一下正则的写法。]下面是代码。主要就是把网页内容读下来,在根据企业负责人名字所在html标签信息写了个正则,把网页内容中符合的都匹配出来在做进一步提取,提取名字求出两个字的名字总数输出。
import urllib2
import re
count2zi,count3zi = 0,0
html = urllib2.urlopen('http://job.csdn.net/event/zpweb/index.html').read()
pattern = re.compile(ur'<span class="name"><a href="cto/\d{6}\.html" target="_blank">.*</a></span>')
match = pattern.findall(html)
print len(match)
for line in match:
posstart = line.find('_blank">')
posend = line.find('</a></span>')
line = line[posstart+8:posend].strip(' \r\n')
print line,len(line)
if 6==len(line):
count2zi += 1
elif 9==len(line):
count3zi += 1
else:
pass
print 'name len is 2 count:',count2zi