用Jsoup从网页上抓取中国地区编号转变成Map

因为项目需求我需要在网站上爬取中国地区编号的信息,用于创建用户的运费模板,数据格式为key为湖南省,value为长沙市,430100
被爬取的网站链接:https://blog.csdn.net/a497785609/article/details/7656330

try {
            //从网站上爬取中国地区编号转变成Map
            Document tbTmallPageDoc = Jsoup.connect("https://blog.csdn.net/a497785609/article/details/7656330").timeout(20000)
                    .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36")
                    .get();
            Elements elements = tbTmallPageDoc.select("div.htmledit_views").select("p").eq(1);
            //格式为一个省份对应多个城市,例如:key为湖南省,value为长沙市,430100
            Map<String, Map<String, String>> linkedHashMap = new LinkedHashMap<>();
            Arrays.asList(elements.html().split("<br>")).forEach(x -> {
                        Map<String, String> map = new HashMap<>();
                        List<String> stringList = Arrays.asList(x.split("&nbsp;")).stream()
                                .filter(z -> !z.isEmpty()).collect(Collectors.toList());
                        stringList = stringList.subList(2, stringList.size() - 3);
                        for (int i = 0; i < stringList.size(); i++) {
                            //如果linkedHashMap已经key已存在则获取value
                            String key = stringList.get(i) + ";" + stringList.get(++i);
                            if (linkedHashMap.containsKey(key)) {
                                map = linkedHashMap.get(key);
                                map.put(stringList.get(++i), stringList.get(++i));
                                linkedHashMap.put(key, map);
                            } else {
                                map.put(stringList.get(++i), stringList.get(++i));
                                linkedHashMap.put(key, map);
                            }
                        }
                    });
        } catch (IOException e) {
            e.printStackTrace();
        }
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Acmen-zym

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值