python spider 处理post请求的求解？

没啥技术的小白

已于 2022-09-20 09:20:25 修改

阅读量138

点赞数

文章标签： python

于 2022-09-20 09:17:07 首次发布

本文链接：https://blog.csdn.net/weixin_44789086/article/details/126946038

版权

处理有道云在线翻译的post请求，代码如下，最后运行代码，为什么运行错误？

from urllib import request

import urllib

#构造请求头信息

header={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) App" "leWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.42" "40.198 Safari/537.36"}

# url网址 https://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule url=r"http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"

key="自学"

# post请求需要提供的参数

formdata={ "i":key,

"from":"AUTO",

"to":"AUTO",

"smartresult":"dict",

"client":"fanyideskweb",

"salt":"16622993877070",

"sign":"0fb63f31f6937a9f5360cfd32bb241cb",

"lts":"1662299387707",

"bv":"b0ff5d17f404993192085bf8b1e93587",

"doctype":"json",

"version":"2.1",

"keyfrom":"fanyi.web",

"action":"FY_BY_REALTlME" }

# 经过urlencode转码

data=urllib.parse.urlencode(formdata).encode(encoding="utf-8")

# 如果request里的data参数有值，那么这个请求为post请求 req=request.Request(url,data=data,headers=header) reponse=request.urlopen(req).read().decode()

print(reponse)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

没啥技术的小白

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python循环post请求_循环post请求太多

weixin_36225248的博客

02-10

1556

我正在做一个scrapy spider，我必须发送一个post请求循环才能转到下一个页面，问题是它只发送一个post请求。querystring更改每个页面的元素“currentPage”，因此我必须为每个页面更改此键的值并发送post。但是，正如我之前所说，它在第一个Post请求之后停止。在import scrapyheaders = {'accept': "*/*",'origin': "ht...

spider_使用request库进行post传参

weixin_30702887的博客

06-05

158

# from urllib import parse,request# import jsonimport requests# 有道翻译urlurl = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"# post的参数parameter = { "i":"hello", "from":"...

1 条评论您还未登录，请先登录后发表或查看评论

spider使用post请求总结

lovehave的博客

11-19

792

spider pc版百度翻译接口 post方式

wtujoxk的博客

07-16

667

这是get版：电脑版百度翻译接口python爬虫（get版）分析过程，略……，有时间再补 python代码： #!/usr/bin/env python # -*- coding:utf-8 -*- ''' 爬虫之百度翻译需要的库有 js2py, requests, re, json ''' __author__ = 'YXQ' import js2py import r...

python爬虫网络请求与request库的使用

mysql110_的博客

09-16

232

一.什么是爬虫？网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。二.爬虫的分类 1.通用爬虫随着网络的迅速发展，万维网成为大量信息的载体，如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine)，例如传统的通...

为什么Spyder是适用于科学的最佳Python IDE

cumei1658的博客

07-12

1081

Spyder is the best IDE that I have tested so far for doing data analysis, but also for plain programming. In this post I will start to briefly describe the IDE. Following the description of this top I...

python爬取网页数据+json数据处理+post请求处理-spider.py

08-18

python3代码，包含了处理post请求爬取网页数据代码，注释部分包括对json数据的处理。如果有疑问，随时扣me *-*

python spider python 图片爬虫-pythonspider2018.zip

01-31

在这个"pythonspider2018-master"项目中，可能包括了以上提到的一些代码示例和配置文件，学习该项目可以帮助我们理解如何在Python中构建一个完整的图片爬虫系统，包括爬取、解析、下载以及处理图片等各个环节。...

python使用scrapy发送post请求的坑

09-20

在Python的Web爬虫开发中，Scrapy框架和requests库都是常用工具，它们在处理HTTP请求时各有特点。...理解这些差异，以及如何在Scrapy中适当地构造和处理POST请求，对于编写高效且可靠的Scrapy爬虫至关重要。

PythonDemo+PythonSpider

02-29

PythonDemo文件夹：包含第三库:matplotlib（2D绘图库）,wordcloud（词云...PythonSpider文件夹主要包括一些爬虫（知乎，妹子图等等）的实现，目前更新了下列文章 selenium在爬虫领域的初涉（自动打开网站爬取信息）

Python3爬虫Scrapy框架发送post请求详细笔记（带代码）

Songsong

07-11

5636

scrapy 简单的post请求(先把我用的拿出来表示尊敬) 学了本文你能学到什么？仅供学习，如有疑问，请留言。。。 import scrapy #发送post请求这里的post请求没有实际的应用直接使用request来发送post请求比较简单 #需求通过百度翻译中的搜索也就是post请求这里搜索的内容是dog class PostSpider(scrapy.S...

python爬取网站数据（post)方式

well2049的博客

01-06

5644

最近python太火了，所以也拿来学习一下。按照网上的教程写了一下简单的post数据请求。我使用的环境python3.6，使用的到库有urllib和beautifulsoup python的安装还是非常简单的，直接到官网下载后安装即可。第三方库的安装执行 pip install beautilfulsoup4 pip install requests 当然使用内建的模块urli

Python爬虫从入门到放弃（十五）之 Scrapy框架中Spiders用法

你身后的人

04-21

2028

本文出自“python修行路”博客，http://www.cnblogs.com/zhaof/p/7192503.htmlSpider类定义了如何爬去某个网站，包括爬取的动作以及如何从网页内容中提取结构化的数据，总的来说spider就是定义爬取的动作以及分析某个网页工作流程分析以初始的URL初始化Request，并设置回调函数，当该request下载完毕并返回时，将生成response，并作为参数...

爬虫(Spider)学习笔记

kujirashark

06-30

3078

title: Spider(蜘蛛)笔记 date: 2018-06-30 11:23:30 tags: Spider基础作者:李忠林Github:https://github.com/LeezhonglinGitblog: https://leezhonglin.github.io/ Spider学习笔记前言: 网络爬虫（Web Spider。又被称为网页蜘蛛。网络机器人，又称为网页追逐者）...

Spider网络爬虫学习——通过Get、Post方法直接抓取网页内容

SmallStoneSK的专栏

05-23

4831

网络爬虫（又被称为网页蜘蛛，网络机器人），是一种按照一定的规则，自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁，自动索引，模拟程序或者蠕虫。

使用Scrapy框架发送POST请求

最新发布

csdn_aspnet的专栏

10-14

1157

例如，当输入 (0, 3), (0, 0), (0, 1), (3, 0), (3, 3) 时，它产生 (0, 3) (0, 0) (3, 0) (3, 3) 的输出；当输入 (0, 3), (0, 1), (0, 0), (3, 0), (3, 3) 时，输出为 (0, 3) (0, 1) (0, 0) (3, 0) (3, 3)。下一个点被选为在逆时针方向上领先于所有其他点的点，即，如果对于任何其他点 r，我们有“orientation(p, q, r) = 逆时针”，则下一个点是 q。

如何在Python中实现长连接爬虫？

10-12

在Python中，要实现长连接爬虫，你可以使用诸如requests库、Scrapy框架或者第三方库如urllib3和socket等方式。这里以requests库为例，因为它相对简单易懂： **使用requests库**： ```python import requests from requests.adapters import HTTPAdapter from requests.packages.urllib3.util.retry import Retry # 设置一个重试策略，包括无限次尝试（max_retries = float('inf')）和超时等待 retry_strategy = Retry(total=5, backoff_factor=0.5, status_forcelist=[500, 502, 503, 504]) adapter = HTTPAdapter(max_retries=retry_strategy) session = requests.Session() session.mount('http://', adapter) session.mount('https://', adapter) # 使用session发起请求，连接会自动重用 for _ in range(10): # 这里模拟多次请求 response = session.get('http://example.com') print(response.text) ``` 在这个例子中，`Session()`创建了一个持久化的连接池，每个请求都会复用之前的连接，除非遇到错误，此时会按照Retry Strategy进行重试。 **使用Scrapy框架**： Scrapy内置了长连接的支持，你可以在中间件（Middleware）中实现，例如使用`DownloaderMiddleware`来重用连接： ```python class CustomDownloaderMiddleware(object): def process_request(self, request, spider): if not request.meta.get('dontReuse', False): request.meta['proxy'] = None # 如果有代理则移除，防止使用代理导致无法复用 request.meta['download_slot'] = None # 请求一个下载槽，让Scrapy知道可以重用连接 def process_response(self, request, response, spider): if request.meta.get('download_slot'): del request.meta['download_slot'] return response ``` 然后在settings.py中启用长连接： ```python DOWNLOADER_MIDDLEWARES = { 'your_spider_module.CustomDownloaderMiddleware': 723, # 中间件的位置 } ```