我正试图从这个网页的左边提取城市名(http://www.silvan.dk/butikker)。原因是我需要提取每个城市的实际地址(在链接所指的页面上可以找到,不过,目前我开始提取城市名称)。
更确切地说是从这个容器。但是,由于我刚刚开始使用Python和beauthoulsoup,因此无法提取所需的信息。在
结果应该会告诉我:
城市,连接。在
到目前为止,我已经:import urllib2
import sys, locale, os, re
import lxml.etree
from bs4 import BeautifulSoup
def cp65001(name):
if name.lower() == 'cp65001':
return codecs.lookup('utf-8')
html_page = urllib2.urlopen("http://www.silvan.dk/butikker",'w')
soup = BeautifulSoup(html_page)
li = soup.select("ul > li > a")
for link in li:
print link.get('href')
得到了以下输出:
^{pr2}$
如果有人能给我指点解决办法,我将不胜感激。
我用累了div = soup.find('div', id='leftContent')
lis = div.find_all('li')
num_lis = len(lis)
但一次跑步后就停止工作了,我不知道为什么?
谢谢你抽出时间。在