python包urllib名称

最新推荐文章于 2024-05-03 11:07:56 发布

茁壮小草

最新推荐文章于 2024-05-03 11:07:56 发布

阅读量510

点赞数 1

文章标签： python urllib2 爬虫 lxml utf-8

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xxzhangx/article/details/52188063

版权

在学习《Web Scraping with Python》,发现第32页下面这段代码报错。这段代码的意思是将某个页面全部爬下来。

#!/usr/bin/env python
#coding=utf8

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen("http://en.wikipedia.org/wiki/Kevin_Bacon")
bsObj = BeautifulSoup(html)
for link in bsObj.findAll("a"):
    if "href" in link.attrs:
        print (link.attrs['href'])

经查询，在python3.5版本中是使用urllib.request,而在python2.7中则是urllib2

修改后，在python2.7中运行上面的代码会有警告：
使用警告

这里的警告，并不是说有错误，只是习惯在使用时加上lxml
修改后

#!/usr/bin/env python
#coding=utf8

from urllib2 import urlopen
from bs4 import BeautifulSoup

html = urlopen("http://en.wikipedia.org/wiki/Kevin_Bacon")
bsObj = BeautifulSoup(html,"lxml")
for link in bsObj.findAll("a"):
    if "href" in link.attrs:
        print (link.attrs['href'])

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python包urllib名称

在学习《Web Scraping with Python》,发现第32页下面这段代码报错。这段代码的意思是将某个页面全部爬下来。#!/usr/bin/env python#coding=utf8from urllib.request import urlopenfrom bs4 import BeautifulSouphtml = urlopen("http://en.wikipedia.or
复制链接

扫一扫

茁壮小草 CSDN认证博客专家 CSDN认证企业博客

码龄8年

185: 原创

4万+: 周排名

223万+: 总排名

247万+: 访问

: 等级

1万+: 积分

372: 粉丝

750: 获赞

231: 评论

2167: 收藏

私信

关注

热门文章

分类专栏

git 6篇
Python 62篇
机器学习 23篇
LaTeX 4篇
数据结构 9篇
工具类 6篇
sql 9篇
shell 4篇

最新评论

R语言技巧：读取sas软件的sas格式文件
仙女猪陈未秧: 试了这么多代码就你这个打开sas文件了感谢哦
R语言软件版本自动更新
weixin_57587576: 我操作到后面显示“The setup files are corrupted.Please obtain a new copy of the program.”进行不下去了
LaTex | LaTex的数学公式中插入中文
fierce_926: 这个mbox后面如果想跟着再写一个矩阵的话会有一点问题对不齐 mbox改成text之后可以对齐
R语言：读取excel的perl问题
ASSASSINATE098: 该问题还有可能是因为先前设定的工作目录（setwd）与perl.exe所在位置不同，所以不能被找到。
latex中的希腊字母
qq_40640411: 笨办法就是直接给它加大字号emmm

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。