
爬虫
爬虫
千百元
这个作者很懒,什么都没留下…
展开
-
爬虫模拟POST请求https (爬中国银行汇率----中文)
2020.06.26https://srh.bankofchina.com/search/whpj/search_cn.jsp因为中行汇率改版本(改为了https请求,页面也有很大变化),需要重新爬中行汇率,原代码请求的数据总与页面返回的不同,最后感觉应该是模拟的POST是失败的,打断点质量是GET模拟。可能是HTTPS影响吧。试了网上各种方法,测试的的结果 不是POST请求,还是GET,比如,HttpURLConnection , HttpsURLConnection ...原创 2020-06-04 16:11:18 · 1771 阅读 · 0 评论 -
java爬取中国银行汇率数据
最近有个定时任务的需求, 要把中国银行官网上的汇率数据定时抓取下来页面地址https://srh.bankofchina.com/search/whpj/searchen.jsp此处有个大坑!!! 当请求页面传入page不存在时, 网站会返回最后一页的数据,下方有做处理代码实现import org.apache.commons.lang.StringUtils;import org.apache.http.HttpEntity;import org.apache...转载 2020-06-04 11:27:54 · 2094 阅读 · 0 评论