Jsoup爬虫获取公司纳税识别号

天眼查

/**
 * 根据公司名称获取统一社会信用代码
 * 
 * @author xiaofei.xian 日期:2019年3月20日 上午11:12:41
 */
public class GetTaxNumber {
  /**
   * @param args
   */
  public static void main(String[] args) {

    String companyNames[] = {"深圳市九象展览科技有限公司","深证市中智兴展览工程有限公司","上海汉得信息技术股份有限公司","智奥会展(深圳)有限公司"};
    Map<String,String> companyMap = new HashMap<>(companyNames.length);
    Document doc = null;
    for (String companyName : companyNames) {
      try {
        // 获取公司详情页
        doc = Jsoup.connect("https://www.tianyancha.com/search?key="+companyName).validateTLSCertificates(false).get();
        Elements elements = doc.getElementsByAttributeValue("tyc-event-ch", "CompanySearch.Company");
        Elements links = elements.select("a[href]"); 
        if(!links.isEmpty()) {
          String subUrl = links.get(0).attr("href");
          doc = Jsoup.connect(subUrl).validateTLSCertificates(false).get();
          Element divElement = doc.getElementById("containerbaseInfo");
          divElement = divElement.select("table").get(1);
          Element tr = divElement.select("tbody").select("tr").get(3);
          companyMap.put(companyName, tr.child(1).text());
        }
      } catch (IOException e) {
        e.printStackTrace();
      }
    }
    System.out.println(companyMap);
  }
}

 

百度企业信用

/**
 * 根据公司名称获取统一社会信用代码
 * 
 * @author xiaofei.xian 日期:2019年3月20日 上午11:12:41
 */
public class GetTaxNumber {
  public static void main(String[] args) {
    String url = "https://xin.baidu.com/";
    String companyNames[] = {"深圳市九象展览科技有限公司", "深圳市中智兴展览工程有限公司", "上海汉得信息技术股份有限公司", "智奥会展(深圳)有限公司"};
    Map<String, String> companyMap = new HashMap<>(companyNames.length);
    Document doc = null;
    for (String companyName : companyNames) {
      try {
        doc = Jsoup.connect(url+"s?q=" + companyName).validateTLSCertificates(false).get();
        Element element = doc.select("a.zx-list-item-url").get(0);
        String subUrl = element.attr("href");
        String pid = subUrl.substring(subUrl.indexOf("?"));
        doc = Jsoup.connect(url+"detail/basicAjax" + pid).validateTLSCertificates(false).get();
        Elements body = doc.select("body");
        JsonParser parser = new JsonParser();
        JsonObject jsonObject = parser.parse(body.text()).getAsJsonObject();
        companyMap.put(jsonObject.get("data").getAsJsonObject().get("entName").getAsString(),
            jsonObject.get("data").getAsJsonObject().get("regNo").getAsString());
      } catch (IOException e) {
        e.printStackTrace();
      }
    }
    System.out.println(companyMap);
  }
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值