[Python]网络数据采集概述(3)—穿越网页表单、登录窗口进行采集

最新推荐文章于 2024-07-30 17:23:09 发布

Vi_NSN

最新推荐文章于 2024-07-30 17:23:09 发布

阅读量343

点赞数

分类专栏：爬虫文章标签： python 爬虫

本文链接：https://blog.csdn.net/Vi_NSN/article/details/77933055

版权

爬虫专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Python Requests库提交表单
提交文件和图像
处理登陆和CookieSessionHttp基本认证

Python Requests库提交表单

params = {"firstname": "Liu", "lastname": "Vi"}
r = requests.post("http://pythonscraping.com/files/processing.php", data=params)
print(r.text)

如果不了解字段name、value或者提交的路径，可以通过查看网页源码或者控制台中查看Network

提交文件和图像

files = {'uploadFile': open("1.jpg", 'rb')}
r = requests.post("http://pythonscraping.com/files/processing2.php", files= files)
print(r.text)

处理登陆和Cookie、Session、Http基本认证

params = {"username": "vi", "password": "password"}
    r = requests.post("http://pythonscraping.com/pages/cookies/welcome.php", data= params)
    print("Cookie is set to: ")
    print(r.cookies.get_dict())
    print("--------------------")
    print("Going to profile page...")
    r = requests.get("http://pythonscraping.com/pages/cookies/profile.php", cookies= r.cookies)
    print(r.text)

Session

session = requests.Session()
params = {'username': 'vi', 'password': 'password'}
s = session.post("http://pythonscraping.com/pages/cookies/welcome.php", data= params)
print("Cookie is set to: ")
print(s.cookies.get_dict())
print("-------------------")
print("Going to profile page...")
s = session.get("http://pythonscraping.com/pages/cookies/profile.php")
print(s.text)
print(session.headers)
print('---------------')
print(session.cookies)

HTTP基本接入认证

auth = HTTPBasicAuth('vi', 'password')
r = requests.post(url= "http://pythonscraping.com/pages/auth/login.php", auth= auth)
print(r.text)

参考书籍：
《Python网络数据采集》

Vi_NSN

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
[Python]网络数据采集概述(3)—穿越网页表单、登录窗口进行采集

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦：Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I
复制链接

扫一扫