urllib/urllib2和BeautifulSoup爬虫学习

最新推荐文章于 2021-09-10 12:13:07 发布

Blueskea

最新推荐文章于 2021-09-10 12:13:07 发布

阅读量1.2k

点赞数 1

文章标签：爬虫

本文链接：https://blog.csdn.net/u013897012/article/details/55522252

版权

一、urllib/urllib2常用方法

1. 简单访问网址

urllib.urlopen(url).read() #返回网页源代码

2. 加cookies的请求

urllib.request

二、BeautifulSoup常用方法

1. 常用方法

content = urllib.urlopen(url).read()
soup = BeautifulSoup(content,"lxml")

print soup.title  # <title>这里是标题<title>
print soup.title.string  # 这里是标题

#<p id="attrName">xxx</p>
print soup.p["id"]  # attrName

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Blueskea

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
urllib/urllib2和BeautifulSoup爬虫学习

一、urllib/urllib2常用方法1. 简单访问网址urllib.urlopen(url).read() #返回网页源代码2. 加cookies的请求urllib.request二、BeautifulSoup常用方法1. 常用方法content = urllib.urlopen(url).read()soup = BeautifulSoup(content,"lxml")print soup
复制链接

扫一扫