python 字符串匹配获取网页标题_模拟匹配Python(url)中大量文本中的字符串

对你来说听起来并不像你需要任何“模糊”匹配.而且我假设当你说“url”时你的意思是“网址指向网址的网页”.只需使用Python的内置子串搜索功能:

>>> import urllib2

>>> webpage = urllib2.urlopen('http://www.dmx.com/about/our-clients')

>>> webpage_text = webpage.read()

>>> webpage.close()

>>> for name in ['Caribou Coffee', 'Express', 'Sears']:

... if name in webpage_text:

... print name, "found!"

...

Caribou Coffee found!

Express found!

>>>

如果您担心字符串大小写不匹配,只需将其全部转换为大写.

>>> webpage_text = webpage_text.upper()

>>> for name in ['CARIBOU COFFEE', 'EXPRESS', 'SEARS']:

... if name in webpage_text:

... print name, 'found!'

...

CARIBOU COFFEE found!

EXPRESS found!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值