PythonChallenge第二关

        我胡汉三又回来了……大笑主要是指之前已经写过一次,http://blog.csdn.net/sndyangd/article/details/7746956

        这不?若干天后,我又在回顾这题,实在是后面的题目涉及到各种各样的模块,我一个都不认识,不会用啊!也就正则表达式用到过。

        话说上次用urlopen,自己误认为是失败了,其实没有,只是比较慢而已。能用程序从网上读代码下来当然要比我之前手工好。

        然后需要把前面的html代码部分和提示部分给剔掉,就用最简单易行的方法,find提示部分后面的-->符号的位置,就可得到子串了。

        剩下的则交给正则表达式了。

 

import re
import urllib2

page = urllib2.urlopen("http://www.pythonchallenge.com/pc/def/ocr.html")
text = page.read()
find_begin = text.find('-->') + len('-->')
text = text[find_begin:]
result = re.findall(r'[a-z]', text)
print ''.join(result)
page.close()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值