python3爬虫-urllib+BeautifulSoup

最新推荐文章于 2023-03-27 18:27:15 发布

wsx_iot

最新推荐文章于 2023-03-27 18:27:15 发布

阅读量786

点赞数

分类专栏： python 文章标签： urllib BeautifulSoup

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29630271/article/details/79265797

版权

python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

urllib

在Python2版本中，有urllib和urlib2两个库可以用来实现request的发送。而在Python3中，已经不存在urllib2这个库了，统一为urllib。Python3 urllib库包括了四个模块。
urllib.request for opening and reading URLs
urllib.error containing the exceptions raised by urllib.request
urllib.parse for parsing URLs
urllib.robotparser for parsing robots.txt files

import urllib.request
from bs4 import BeautifulSoup

response = urllib.request.urlopen("http://www.biqukan.com/1_1094/")
html = response.read().decode("gbk")
div_bf = BeautifulSoup(html)
div = div_bf.find_all('div', class_ = 'listmain')
a_bf = BeautifulSoup(str(div[0]))
a = a_bf.find_all('a')
for each in a:
    print(each.string, each.get('href'))

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

wsx_iot CSDN认证博客专家 CSDN认证企业博客

码龄9年

159: 原创

5万+: 周排名

1万+: 总排名

33万+: 访问

: 等级

4403: 积分

125: 粉丝

188: 获赞

62: 评论

576: 收藏

私信

关注

热门文章

分类专栏

go 2篇
算法 10篇
中间件 2篇
大数据 15篇
linux 22篇
c/c++ 25篇
java 22篇
嵌入式 10篇
数据库 11篇
web 16篇
python 8篇
other 30篇

最新评论

java中的并发同步方法
CSDN-Ada助手: Java 技能树或许可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
java并发之synchronized
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
make_heap(), pop_heap(), push_heap()用法
heibut不相信眼泪: 对调写的不对吧？只是把栈顶移到了栈低
开发板linux连接wifi的方法（一）
爱钓鱼的歪猴: 搞了一晚上，很感谢博主的这篇文章
maven学习笔记
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录；(2)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(3)使用更多的站内链接。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。