python获取页面数据的方法（一）

最新推荐文章于 2024-05-01 20:18:25 发布

依剑仗天涯

最新推荐文章于 2024-05-01 20:18:25 发布

阅读量5.7k

点赞数 1

分类专栏： python 爬虫文章标签： python 抓取页面数据

本文链接：https://blog.csdn.net/sun_daming/article/details/90237494

版权

python 同时被 2 个专栏收录

47 篇文章 0 订阅

订阅专栏

爬虫

12 篇文章 0 订阅

订阅专栏

天下的网站没有我爬不到的，只有不想爬的（有吹牛逼之嫌）。

Python2慢慢被Python3所代替了，主要以3为主，话不多说，直接看技术点吧

爬取的网站：url = ‘https://www.baidu.com/’

requests的方法

import requests

url = 'https://www.baidu.com/'
req = requests.get(url)
obj = req.content.decode('utf-8')
print(obj)

Urllib的方法

import urllib.request

url = 'https://www.baidu.com/'
req = urllib.request.urlopen(url)
obj = req.read().decode('utf-8')
print(obj)

'''
import urllib.request
url = 'https://www.baidu.com/'

header = {'user-Agent':'Mozilla/5.0'}
req = urllib.request.Request(url,headers=header)
obj = urllib.requese.urlopen(req)
response = obj.read().decode('utf-8')
print(response)

'''

基于urllib的request

from urllib import request

url = 'https://www.baidu.com/'
req = request.urlopen(url)
obj = req.read().decode('utf-8')
print(obj)

我习惯用第一种，简单粗暴，有别的方法，请大家留言

依剑仗天涯

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
2
评论
python获取页面数据的方法（一）

天下的网站没有我爬不到的，只有不想爬的（有吹牛逼之嫌）。Python2慢慢被Python3所代替了，主要以3为主，话不多说，直接看技术点吧爬取的网站：url = ‘https://www.baidu.com/’requests的方法 import requestsurl = 'https://www.baidu.com/'req = requests.get(url)...
复制链接

扫一扫