html中无序列表做成链接,Beautifulsoup从无序列表中提取文本和链接div<ul<li（斯堪的纳维亚字符）...

最新推荐文章于 2023-01-17 14:34:37 发布

刘百功

最新推荐文章于 2023-01-17 14:34:37 发布

阅读量295

点赞数

文章标签： html中无序列表做成链接

我正试图从这个网页的左边提取城市名(http://www.silvan.dk/butikker)。原因是我需要提取每个城市的实际地址(在链接所指的页面上可以找到，不过，目前我开始提取城市名称)。

更确切地说是从这个容器。但是，由于我刚刚开始使用Python和beauthoulsoup，因此无法提取所需的信息。在

结果应该会告诉我：

城市，连接。在

到目前为止，我已经：import urllib2

import sys, locale, os, re

import lxml.etree

from bs4 import BeautifulSoup

def cp65001(name):

if name.lower() == 'cp65001':

return codecs.lookup('utf-8')

html_page = urllib2.urlopen("http://www.silvan.dk/butikker",'w')

soup = BeautifulSoup(html_page)

li = soup.select("ul > li > a")

for link in li:

print link.get('href')

得到了以下输出：

^{pr2}$

如果有人能给我指点解决办法，我将不胜感激。

我用累了div = soup.find('div', id='leftContent')

lis = div.find_all('li')

num_lis = len(lis)

但一次跑步后就停止工作了，我不知道为什么？

谢谢你抽出时间。在

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
html中无序列表做成链接,Beautifulsoup从无序列表中提取文本和链接div<ul<li（斯堪的纳维亚字符）...

我正试图从这个网页的左边提取城市名(http://www.silvan.dk/butikker)。原因是我需要提取每个城市的实际地址(在链接所指的页面上可以找到，不过，目前我开始提取城市名称)。更确切地说是从这个容器。但是，由于我刚刚开始使用Python和beauthoulsoup，因此无法提取所需的信息。在结果应该会告诉我：城市，连接。在到目前为止，我已经：import urllib2impor...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。