今天接到一个需求,需要知道手机号的归属地。网上搜了手机号解析的网站,还有对应提供api接入的开放平台要秘钥。想到有爬虫可以爬取数据。就写了一个小的爬虫代码:
访问地址:http://shouji.xpcha.com/1852170627.html
附代码:
import com.google.common.collect.Maps; import java.io.IOException; import java.util.Map; import java.util.regex.Matcher; import java.util.regex.Pattern; import static java.util.regex.Pattern.compile; /** * <b></b> * * @author Yu Mengyao * @date 2018/8/29 15:01 */ public class HttpReptileUtils { private final static String PHONE_URL_PREFIX = "http://shouji.xpcha.com/"; private final static String PHONE_URL_SUFFIX = ".html"; public static Map<String, String> getPhoneInfo(String phone) { String url = PHONE_URL_PREFIX.concat(phone).concat(PHONE_URL_SUFFIX); Map<String, String> map = Maps.newHashMapWithExpectedSize(2); try {