获取落户名单
获取落户名单的Ajax请求返回的居然是HTML,想法比较惊奇。直接写个正则表达式,提取想要的数据。
private final static Pattern LIST_PATTERN = Pattern.compile(
“[<]*?<td[>]?>(\S?)[<]*?<td[>]?>(\S?)[<]*?<td[>]?>(\d+)\-(\d+)[<]*?<td[>]?>(\S*?)[<]*?<td[>]?>(\S?)[<]*?<td[>]?>[<]*?<a[\s\S]*?οnclick=“showDetails\(‘(\d+)’\)”>查看</a>[<]?[^<]*?”);
private static List findPersonList() throws InterruptedException {
String url = “http://fuwu.rsj.beijing.gov.cn/jf2021integralpublic/settlePerson/tablePage”;
List personList = new ArrayList<>();
for (int page = 0; page <= 6040; page += 10) {
Map<String, String> params = new HashMap<>();
params.put(“name”, “”);
params.put(“rows”, “10”);
params.put(“page”, Integer.toString(page));
String result = HttpUtils.doPost(url, params);
Matcher matcher = LIST_PATTERN.matcher(result);
while (matcher.find()) {
Person person = new Person();
person.setNumber(matcher.group(1));
person.setName(matcher.group(2));
person.setYear(Integer.parseInt(matcher.group(3)));
person.setMonth(Integer.parseInt(matcher.group(4)));
person.setCompany(matcher.group(5));
person.setTotalScore(Double.parseDouble(matcher.group(6)));
person.setId(Integer.parseInt(matcher.group(7)));
personList.add(person);
}
log.info("page: {} ", page);
Thread.sleep(1000);
}
return personList;
}
获取积分详情
积分详情的Ajax请求返回也是HTML,直接写10个正则表达式,提取想要的数据。
private final static Pattern[] DETAIL_PATTERN_ARRAY = {
Pattern.compile(“合法稳定就业[<]*?<td[>]*?>([\d\.\-]+)”),
Pattern.compile(“合法稳定住所[<]*?<td[>]*?>([\d\.\-]+)”),
Pattern.compile(“教育背景[<]*?<td[>]*?>([\d\.\-]+)”),
Pattern.compile(“扣除取得学历(学位)期间累计的居住及就业分值[<]*?<td[>]*?>([\d\.\-]+)”),
Pattern.compile(“创新创业[<]*?<td[>]*?>([\d\.\-]+)”),
Pattern.compile(“职住区域[<]*?<td[>]*?>([\d\.\-]+)”),
Pattern.compile(“纳税[<]*?<td[>]*?>([\d\.\-]+)”),
Pattern.compile(“年龄[<]*?<td[>]*?>([\d\.\-]+)”),
Pattern.compile(“荣誉表彰[<]*?<td[>]*?>([\d\.\-]+)”),
Pattern.compile(“守法记录[<]*?<td[>]*?>([\d\.\-]+)”),
};
private static void enrichPersonList(List personList) throws InterruptedException {
String url = “http://fuwu.rsj.beijing.gov.cn/jf2021integralpublic/settlePerson/settlePersonDetails”;
for (int i = 0; i < personList.size(); i++) {
Person person = personList.get(i);
Map<String, String> params = new HashMap<>();
params.put(“id”, Integer.toString(person.getId()));
String result = HttpUtils.doPost(url, params);
double[] detailScore = new double[DETAIL_PATTERN_ARRAY.length];
for (int j = 0; j < DETAIL_PATTERN_ARRAY.length; j++) {
Matcher matcher = DETAIL_PATTERN_ARRAY[j].matcher(result);
if (matcher.find()) {
detailScore[j] = Double.parseDouble(matcher.group(1));
} else {
log.error(“index: {}\n{}”, j, result);
}
}
person.setDetailScore(detailScore);
log.info(“person count: {} / {}”, i, personList.size());
Thread.sleep(1000);
最后
关于面试刷题也是有方法可言的,建议最好是按照专题来进行,然后由基础到高级,由浅入深来,效果会更好。当然,这些内容我也全部整理在一份pdf文档内,分成了以下几大专题:
- Java基础部分
- 算法与编程
- 数据库部分
- 流行的框架与新技术(Spring+SpringCloud+SpringCloudAlibaba)
这份面试文档当然不止这些内容,实际上像JVM、设计模式、ZK、MQ、数据结构等其他部分的面试内容均有涉及,因为文章篇幅,就不全部在这里阐述了。
作为一名程序员,阶段性的学习是必不可少的,而且需要保持一定的持续性,这次在这个阶段内,我对一些重点的知识点进行了系统的复习,一方面巩固了自己的基础,另一方面也提升了自己的知识广度和深度。
)]
这份面试文档当然不止这些内容,实际上像JVM、设计模式、ZK、MQ、数据结构等其他部分的面试内容均有涉及,因为文章篇幅,就不全部在这里阐述了。
作为一名程序员,阶段性的学习是必不可少的,而且需要保持一定的持续性,这次在这个阶段内,我对一些重点的知识点进行了系统的复习,一方面巩固了自己的基础,另一方面也提升了自己的知识广度和深度。