python爬虫第一步

最新推荐文章于 2023-07-10 14:36:37 发布

st_lucien

最新推荐文章于 2023-07-10 14:36:37 发布

阅读量270

点赞数

分类专栏： python 文章标签： python 爬虫

本文链接：https://blog.csdn.net/st_lucien/article/details/73466141

版权

python 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

首先，我们需要拿到一个网页的全部内容

例如：

url = 'http://example.webscraping.com/'
# 1
from urllib import request
html = request.urlopen(url)
print(html.read())
# 2
from requests import get
html = get(url)
print(html.text)
# 3
from pyquery import PyQuery as pq
html = pq(url)
print(html)

这3种方法都可以简单地拿到一个网页的内容，urllib是python3自带的库，requests和pyquery是第三方库，需要安装（pip install requests/pyquery）一般来讲，新手推荐使用自带的urllib，根据一些大神的测试，requests库的效率会比urllib高，另外pyquery虽然可以拿到网页内容，但一般是用来作为解析工具所以个人建议使用urllib和requests库

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

st_lucien

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫第一步

首先，我们需要拿到一个网页的全部内容例如：url = 'http://example.webscraping.com/'# 1from urllib import requesthtml = request.urlopen(url)print(html.read())# 2from requests import gethtml = get(url)print(html.t
复制链接

扫一扫