html中无序列表做成链接,Beautifulsoup从无序列表中提取文本和链接div<ul<li(斯堪的纳维亚字符)...

我正试图从这个网页的左边提取城市名(http://www.silvan.dk/butikker)。原因是我需要提取每个城市的实际地址(在链接所指的页面上可以找到,不过,目前我开始提取城市名称)。

更确切地说是从这个容器。但是,由于我刚刚开始使用Python和beauthoulsoup,因此无法提取所需的信息。在

结果应该会告诉我:

城市,连接。在

到目前为止,我已经:import urllib2

import sys, locale, os, re

import lxml.etree

from bs4 import BeautifulSoup

def cp65001(name):

if name.lower() == 'cp65001':

return codecs.lookup('utf-8')

html_page = urllib2.urlopen("http://www.silvan.dk/butikker",'w')

soup = BeautifulSoup(html_page)

li = soup.select("ul > li > a")

for link in li:

print link.get('href')

得到了以下输出:

^{pr2}$

如果有人能给我指点解决办法,我将不胜感激。

我用累了div = soup.find('div', id='leftContent')

lis = div.find_all('li')

num_lis = len(lis)

但一次跑步后就停止工作了,我不知道为什么?

谢谢你抽出时间。在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值