python网络爬虫-基础篇

最新推荐文章于 2024-10-01 05:04:32 发布

Tttian622

最新推荐文章于 2024-10-01 05:04:32 发布

阅读量224

点赞数 5

分类专栏： python爬虫文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/Tttian622/article/details/142467636

版权

python爬虫专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1.get请求：

请求京东（为例）主页的内容，并打印出它的HTML源代码。

import requests
response = requests.get(url='https://www.jd.com')
print(response.text)

2.post请求：

GET请求用于请求数据，而POST请求用于提交数据。

import requests
data = {"name":"测试"}
#post请求获取页面数据
response = requests.post("https://httpbin.org/post",data=data)
print(response.text)

3.get带参数请求

import requests

data = {"key1":"value1","key2":"value2"}

response = requests.get('https://httpbin.org/get',params=data)

print(response.url)
print(response.headers)
print(response.text)

4.获取响应数据

1.把网站的图片保存在本地

使用reques模块可以获得整个页面数据

如果希望获得页面中的某一种数据可以获取网站中的数据地址，例如

https://game.gtimg.cn/images/yxzj/cp/a20170829bbgxsm/lb_s36.jpg

import requests
response = requests.get('https://game.gtimg.cn/images/yxzj/cp/a20170829bbgxsm/lb_s36.jpg')
with open('tupian.jpg','wb') as f:
    f.write(response.content)

2.获得JSON

JSON（JavaScript Object Notation）是一种轻量级的数据交换格式

response = requests.get("http://httpbin.org/ip")
data = response.json()
print(data)
print(data['origin'])

#获取状态码
print(response.status_code)

5.自定义请求头信息

import requests
header = {
    'user-agent':'haha/v1'
}
response = requests.get('http://httpbin.org/get',headers=header)
print(response.headers)#获得请求头信息
print(response.request.headers)#获得响应头信息

6.查看服务端的cookie设置

cookie是一种存储在用户浏览器中的小型数据片段，

它允许服务器识别用户的浏览器，并存储关于用户的一些信息。

import requests
#访问目标
url = "https://www.baidu.com"
#请求头信息
header={
"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36 Edg/129.0.0.0"
}
response = requests.get(url=url,headers=header)
print(response.cookies)
print(response.cookies['BAIDUID'])

也可自定义设置cookie，发起请求时，携带cookie数据访问服务端

url = 'http://httpbin.org/cookies'
cookies = dict(cookie_arg='hello world')
response = requests.get(url=url,cookies=cookies)
print(response.text)

Tttian622

关注

5
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录