在使用 HttpGet 发送 HTTP 请求时,为了保证 URL 的正确性和完整性,可以对 URL 进行以下容错处理:
对 URL 中的空格和特殊字符进行 URL 编码,避免请求失败或异常。
String url = "http://www.example.com/search?q=hello world";
url = URLEncoder.encode(url, "UTF-8");
HttpGet get = new HttpGet(url);
对 URL 中的非法字符进行过滤,避免攻击和恶意访问,例如:
String url = "http://www.example.com/search?q=hello%20world<script>alert('xss');</script>";
url = url.replaceAll("<.*?>", "");
HttpGet get = new HttpGet(url);
对 URL 中的参数进行验证和过滤,避免攻击和恶意访问,例如:
String url = "http://www.example.com/search";
List<NameValuePair> params = new ArrayList<>();
params.add(new BasicNameValuePair("q", "hello world<script>alert('xss');</script>"));
params = params.stream().filter(pair -> pair.getValue() != null).collect(Collectors.toList());
String queryString = URLEncodedUtils.format(params, "UTF-8");
HttpGet get = new HttpGet(url + "?" + queryString);
对 URL 的长度进行限制,避免请求过长而被服务器拒绝或异常,例如:
String url = "http://www.example.com/search?q=hello world";
if (url.length() > 1024) {
throw new IllegalArgumentException("URL too long");
}
HttpGet get = new HttpGet(url);
对 URL 中的主机名进行 DNS 解析,避免 DNS 污染和恶意攻击,例如:
String url = "http://www.example.com/search?q=hello world";
URI uri = new URI(url);
InetAddress[] addresses = InetAddress.getAllByName(uri.getHost());
HttpGet get = new HttpGet(uri);
对 URL 的协议和端口进行验证,避免使用不安全的协议和端口,例如:
String url = "http://www.example.com/search?q=hello world";
URI uri = new URI(url);
if (!uri.getScheme().equalsIgnoreCase("https")) {
throw new IllegalArgumentException("Only HTTPS protocol allowed");
}
if (uri.getPort() != -1 && uri.getPort() != 443) {
throw new IllegalArgumentException("Invalid port number");
}
HttpGet get = new HttpGet(uri);
需要注意的是,容错处理的具体方式和实现方式可能会根据具体的业务需求和安全要求而有所不同,需要结合实际情况综合考虑。