python爬虫:在搜狗通过关键字获取网页资源

最新推荐文章于 2022-09-19 21:03:04 发布

Jmayday

最新推荐文章于 2022-09-19 21:03:04 发布

阅读量1k

点赞数 1

分类专栏： python爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jmayday/article/details/106108449

版权

python爬虫专栏收录该内容

8 篇文章 0 订阅

订阅专栏

代码如下：

import requests
# 指定url
url = 'https://www.sogou.com/web'
# 输入搜索关键字
keyword =input('enter a key word:')
# UA伪装 
# 浏览器不同但是其代理对象是一致的
headers = {
    'User-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36',
}
# 将关键字放入到字典当中
params ={
    'query':keyword
}
# 发起get请求
response = requests.get(url=url,params=params,headers=headers)
# 将get请求的数据以字符串的形式存储，再进行utf-8编码,在此之前要设置response的编码方式
response.encoding = 'utf-8'
page_text=response.text
# 持久化存储
with open('./hl.html','w',encoding='utf-8') as fp:
    fp.write(page_text)

结果如下图：

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Jmayday CSDN认证博客专家 CSDN认证企业博客

码龄7年

228: 原创

3万+: 周排名

78万+: 总排名

81万+: 访问

: 等级

7273: 积分

350: 粉丝

577: 获赞

232: 评论

3352: 收藏

私信

关注

热门文章

分类专栏

Flink 2篇
python 38篇
MySQL 28篇
ETL 29篇
经典题库 9篇
python数据分析 12篇
FineReport 29篇
Oracle 12篇
Hadoop 19篇
Java 18篇
PostgreSQL 6篇
ERP(T100) 2篇
python爬虫 8篇
Linux 7篇
网络 11篇
数据挖掘 1篇
cloud computing 4篇
shell 7篇
c语言 10篇
experience 11篇
工具技巧 21篇
生活小悟 9篇

最新评论

kettle使用教程(超详细)
YX1103Zzz: 大佬，kettle 怎么连接SAP软件呀
kettle同步doris数据不全问题
申刻: 你好，想请问一下，kettle能够高效对接doirs数据么？，我使用kettle对接doirs数据，速度很慢，每秒大概在200-300条记录。
kettle使用教程(超详细)
m0_67129631: 初始密码是admin
kettle使用教程(超详细)
zhangjin1222: 这里有个基于kettle 9.4 写的系列文章不错，分享给大家 https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzU5NjA1MzY4OQ==&action=getalbum&album_id=2851942000101654531&scene=173&subscene=&sessionid=svr_c6b709790d2&enterid=1705411827&from_msgid=2247484061&from_itemidx=1&count=3&nolastread=1#wechat_redirect
kettle使用教程(超详细)
Jmayday: 可以去官网下载对应版本的驱动，然后用其它工具测试，例如带有jdbc功能的，测试没有问题的话去对应目录把驱动替换就好

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。