我获得以下html:
Acaryochloris_marina_MBIC11017_> Jun 12 2013
Acetobacter_pasteurianus_386B_u> Aug 8 2013
还有更多......
我想从这里提取href。
这是我的python脚本:( page_source包含html)
soup = BeautifulSoup(page_source)
links = soup.find_all('a',attrs={'href': re.compile("^http://")})
for tag in links:
link = tag.get('href',None)
if link != None:
print link
但这会不断返回以下错误:
links = soup.find_all('A',attrs={'HREF': re.compile("^http://")})
TypeError: 'NoneType' object is not callable