通过w3c方式 读取xml内容

/**
     * 通过w3c方式 读取xml内容
     * @param lablenames    要读取的节点名称
     * @param file_path_name 文件绝对路径
     * @return
     */
    public static WebMagic readXML(List<String> lablenames, String file_path_name) {

        
        WebMagic webMagic = new WebMagic();

        try {
            DocumentBuilderFactory factory = DocumentBuilderFactory .newInstance();

            DocumentBuilder builder = factory.newDocumentBuilder();

            org.w3c.dom.Document document = builder.parse(new File(file_path_name));

            org.w3c.dom.Element rootElement = document.getDocumentElement();

            for (int i = 0; i < lablenames.size(); i++) {
                NodeList list = rootElement.getElementsByTagName(lablenames.get(i));
                
                org.w3c.dom.Element element = (org.w3c.dom.Element) list .item(0);

                System.out.println(element.getChildNodes().item(0).getNodeValue());

                if ("starturl".equals(element.getNodeName())) {
                    webMagic.setStarturl(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("regexstarturl".equals(element.getNodeName())) {
                    webMagic.setRegexstarturl(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("labelName".equals(element.getNodeName())) {
                    webMagic.setLabelName(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("labeltype".equals(element.getNodeName())) {
                    webMagic.setLabeltype(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("regexdescendants".equals(element.getNodeName())) {
                    webMagic.setRegexdescendants(element.getChildNodes()
                            .item(0).getNodeValue());
                }

            }

        } catch (Exception e) {

            System.out.println("exception:" + e.getMessage());

        }
        return webMagic;

    }

 

转载于:https://www.cnblogs.com/mengyuxin/p/5635352.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值