【实验目的】
分析企业法人还有哪些关联公司,关联公司注册了哪些域名,这些域名是在哪个云平台注册的。
【思路】
1、对比测试,在不登陆的情况下,“企查查”比“天眼查”能查看到更多的信息。查询企业法人的关联公司,选择用网站“企查查”。本文主要分析这个环节。
2、通过企业名,在“企查查”上获取法人的关联公司。然后用所有的关联公司在“站长之家”上查询他们的域名和所使用的云平台。此环节参考:https://blog.csdn.net/qq_39295735/article/details/83932618
【分析】
1、以“重庆腾讯信息技术有限公司”为例,在“企查查”上搜索该企业,得出网址规则,key后面是企业的名称。第一条记录是我们的查询目标。

2、打开企业详情的页面,分析网址规则,网址最后的一串字符应该是标识该公司的,这一串数字应该可以从上一页的源码中获得。

3、点击法人下面的关联公司的链接,网址后面同样是一串表示法人信息的字符,应该可以从上一个页面的源码中获得。

4、从法人的介绍信息中,把所有的xx公司的名字给提取出来。
5、首先分析第一个网页的源码,找到表示企业的网址字符串“firm_78668b40a82cd573c904

本文通过Python爬虫技术,利用企查查获取企业法人的关联公司信息,并在站长之家查询这些公司的域名及注册云平台。首先对比企查查与天眼查,选择企查查进行分析。接着,提取企业详情页和法人关联公司的URL规则,使用正则表达式匹配所需信息。最终,成功获取并分析了关联公司的域名和云平台数据。
最低0.47元/天 解锁文章


被折叠的 条评论
为什么被折叠?



