python爬虫利器 cURL你用过吗?

hello,小伙伴们,今天给大家分享的开源项目是一个python爬虫利器,感兴趣的小伙伴看完这篇文章不妨去尝试一下,这个开源项目就是curlconverter,不知道小伙伴们分析完整个网站后去code代码的时候,有一个工作特别繁琐,不知道小伙伴们平时有没有注意,就是复制请求头中的header信息,需要重复复制,粘贴,过程有点冗余。今天给大家推荐的这个项目就完美的解决了这个问题,话不多说,直接看效果。

操作流程 以谷歌浏览器为例

1、F12打开控制台,找到Network选项。
2、找到你要请求的URL,右键复制,选中"Copy as cURL"。
3、将你复制的cURL,放到curl command box即可。

curl command box浏览器处理结果

可以选择多种语言,比如:Go,PHP,JavaScript,这里就不一一例举了,我选择的是Python语言。

代码结果展示

import requests

cookies = {
    '_ga': 'GA1.2.1517699888.1586403509',
    '_gid': 'GA1.2.1746914094.1586403509',
}

headers = {
    'Connection': 'keep-alive',
    'Cache-Control': 'max-age=0',
    'Upgrade-Insecure-Requests': '1',
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36',
    'Sec-Fetch-Dest': 'document',
    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
    'Sec-Fetch-Site': 'none',
    'Sec-Fetch-Mode': 'navigate',
    'Sec-Fetch-User': '?1',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'If-None-Match': 'W/"5e659e99-1542"',
    'If-Modified-Since': 'Mon, 09 Mar 2020 01:40:41 GMT',
}

response = requests.get('https://curl.trillworks.com/', headers=headers, cookies=cookies)

项目地址:https://github.com/NickCarneiro/curlconverter/

curl command box地址:https://curl.trillworks.com/

今天的推荐不知道大家喜欢吗?如果你们喜欢话,请在文章底部留言或点赞,以表示对我的支持,你们的留言,点赞,转发关注是我持续更新的动力哦!

关注我的公众号回复:"1024",免费领取一大波学习资源,先到先得哦!

关注我免费领取学习资料

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python爬虫中,curl是一个常用的命令行工具,用于向Web服务器发起请求。它可以通过一系列参数来定制请求的方式和内容。一些常用的参数和用法包括: -A参数用于设置User-Agent,可以模拟不同的浏览器类型。例如,使用curl -A "chrome" https://www.baidu.com 可以将User-Agent设置为Chrome浏览器。 -X参数用于指定请求方法。例如,使用curl -X POST http://httpbin.org/post 可以以POST方法请求指定的URL。 -I参数用于只返回请求的头信息,不包含响应的主体内容。例如,使用curl -I http://www.baidu.com 只会返回HTTP头部信息。 -d参数用于发送POST请求时的参数。例如,使用curl -d "a=1&b=2&c=2" http://httpbin.org/post 可以发送带有参数的POST请求。 -O参数用于下载文件并以远程的文件名保存。例如,使用curl -O http://httpbin.org/image/jpeg 可以下载并保存图片文件。 -o参数用于下载文件并以指定的文件名保存。例如,使用curl -o fox.jpeg http://httpbin.org/image/jpeg 可以下载并保存图片文件,并指定文件名为fox.jpeg。 -L参数用于跟随重定向请求,即自动跳转到重定向的URL。例如,使用curl -IL https://baidu.com 可以跟随重定向请求并返回重定向后的URL的头部信息。 -H参数用于设置请求的头信息。例如,使用curl -o image.webp -H "accept:image/webp" http://httpbin.org/image 可以设置请求头信息,其中"accept:image/webp"表示接受WebP格式的图片。 -k参数用于允许发起不安全的SSL请求,即信任无效的SSL证书。例如,使用curl -k https://www.12306.cn 可以发起对https网站的请求。 -b参数用于设置cookies。例如,使用curl -b "a=test" http://httpbin.org/cookies 可以在请求中设置cookies。 总之,curl是一个在Python爬虫中常用的命令行工具,通过使用不同的参数,可以定制请求的方式和内容,包括设置User-Agent、请求方法、发送参数、下载文件、跟随重定向、设置头信息、允许不安全的SSL请求和设置cookies等功能。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python爬虫curl的基本用法](https://blog.csdn.net/qq_33966519/article/details/108531198)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值