输出响应文本时乱码
首先,reqwest
默认使用 utf-8
来编解码文本,因此乱码问题一般并非是编解码设置不当(当然也存在特殊情况)。
- 从
features
入手
因为如今网站服务器会使用 gzip
算法完成对响应的压缩,导致响应并非响应原文(在浏览器中浏览网页时,浏览器会自动完成对响应的解析,因此我们无感),我们需要借助 reqwest 的 gzip 特征
来完成对响应的解压。
这种情况,执行一行 cargo 就可以解决问题。
cargo add reqwest -F gzip
- 从请求头入手(不一定有效,因为服务器可能会忽视请求头中的设置)
将请求头中的 Accept Encoding
字段移除,表示我们不接受经过 gzip 压缩的响应,当然默认情况下不存在该字段,如果代码中存在该字段的设置的话,可以进行移除。
- 从编码角度(一般无需考虑,因为默认的 utf-8 可以完成全球语言解析)
使用 text_with_charset()
方法
// 注意,此处使用了异步,需要 Tokio
let client = Client::new();
let resp = client.get("https://test.com")
.header(header::USER_AGENT, "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36")
.send().await?;
let text = resp.text_with_charset("一些特殊的编解码格式").await?;