想写一个爬虫爬取集思录网站的可转债信息,使用superagent做了请求库,在做获取列表的可转债列表的时候返回结果总是显示30条(游客只能查看30条记录)
查找问题最终原因是因为发送的报文中没有user-agent
报头
如果不设置用户代理报头,一些服务器可能会拒绝请求或返回与预期不同的响应。因此,在请求中包含一个user-agent
头通常是一个很好的实践。
superagent
.post(urls.loginUrl)
.set("cookie", cookieArr.join("; "))
.set(
"user-agent",
"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36"
)
.type("form")
.send({
return_url: `https://www.jisilu.cn/web/data/cb/list`,
user_name: loginInfo.userName,
password: loginInfo.password,
auto_login: 0,
aes: 1,
})
.then(function (response) {
resolve(response);
});