Java在做网络爬虫时,判断是否含有汉字

构造如下方法(可以直接拿我的代码): 

    /**
     * 判断是否有汉字
     * @param str
     * @return
     * @author:严天贺
     */
    public static boolean extractChinese(String str){
        String results = "";
        Pattern pattern = Pattern.compile("[\u4e00-\u9fa5]");
        Matcher m = pattern.matcher(str);
        if(m.find()){
            return true;
        }

        return false;
    }

在其他java类里可以直接调用这个方法

/**
     * aothor:严天贺
     */
    public static String rules1(String html) {
        String result = "";
        Document document = Jsoup.parse(html);
        Elements elements = document.select("#detail > div.main > div > div.vF_deail_maincontent > div > div.table > table > tbody > tr:nth-child(17) > td:nth-child(2)");
        for (Element element : elements) {
            result = element.text();

        }
        if (  SNRules.extractChinese(result)){
            result = "";
        }

        return result;
    }

小结:当我们遇到问题时,往往人脑会自动默认执行一些方法,但是程序还是不会的,它所使用的方法,都必须由我们提前写好,并且能够正确调用,才能达到我们预期的结果。 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值