python 爬虫

最新推荐文章于 2023-03-31 13:37:14 发布

归来少年Plus

最新推荐文章于 2023-03-31 13:37:14 发布

阅读量462

点赞数

文章标签： python 爬虫开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41709748/article/details/124462068

版权

一、requests
requests模块：python中原生的基于网络请求的模块，功能强大，简单便捷，效率极高

作用：模拟浏览器发请求

1.1如何使用（requests模块的编码流程）：

1、指定url
2、发起请求
3、获取响应数据
4、持久化存储

2 环境安装

pip install requests

1.3 实战编码
request之网页采集


import requests

if __name__ == "__main__":
    header = {
        'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/100.0.4896.127 Mobile Safari/537.36 '
    }
    url = 'https://www.sogou.com/web'
    kw = input('Please enter a word:')
    param = {
        'query': kw
    }
    response = requests.get(url=url, params=param, headers=header)

    page_text = response.text
    fileName = kw + '.html'
    with open(fileName, 'w', encoding='utf-8') as fp:
        fp.write(page_text)
    print(fileName, '保存成功！！！')

显示结果为：
在这里插入图片描述

4.UA伪装
让爬虫对应的请求载体身份标识伪装成某一款浏览器。

归来少年Plus

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

归来少年Plus CSDN认证博客专家 CSDN认证企业博客

码龄7年

304: 原创

12万+: 周排名

1万+: 总排名

65万+: 访问

: 等级

5420: 积分

708: 粉丝

724: 获赞

54: 评论

996: 收藏

私信

关注

热门文章

分类专栏

微服务 13篇
数据库 13篇
istio 22篇
架构 20篇
python 4篇
安全 4篇
性能优化 1篇
大数据 32篇
kafka 2篇
测试 1篇
MQ 6篇
开心一刻 1篇
电子相册部署
概 13篇
docke 20篇
linu 11篇
k8 27篇
haprox 1篇
java 32篇
openstack 1篇
开发技巧 4篇
go 1篇
Jenkins 1篇
前端 16篇

最新评论

使用java代码给Excel加水印，保真，新鲜出炉
weixin_44069670: 是因为CTSheetBackgroundPicture这个class没有，顶级漏洞
vue3的nginx配置文件配置(nginx只配置前端vue3的nginx.conf文件)
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
ChatGPT/GLM API使用
普通网友: 这篇文章真是一篇佳作!作者运用了生动有趣的语言,将枯燥的理论知识娓娓道来,让人如沐春风。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
阿里云ECS服务器安装docker
普通网友: 支持一下！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
使用java代码给Excel加水印，保真，新鲜出炉
leisdelta: xssfSheet.getCTWorksheet().addNewPicture().setId(pr.getId());==>这一句的方法车轮子都没提供了,不知道是不是版本的问题,没生效

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。