如何获取到全国所有公司名称?
文章目录
灵魂提问
你所处的是什么行业?
你所处行业有多少和你一样体量的公司?
你如何在你同类型公司中杀出一条血路?
你所处行业的互联网覆盖率是多少?
你的产品是怎么样进行销售? 电销? 地推?
你如何监听你的客户信息?
你如何监听你的竞品公司信息?
…
一、在中国有多少家公司?
如果想要知道中国有多少家公司,我们第一想到的可能就是问问万能的度娘,中国有多少家公司,身为资深的广告搜索引擎百度会告诉你这问题我不会。
那么本人来一个粗浅的解答。
2019年因项目需要致电某眼查销售得出具体数据中国全国公司数量为1.9E左右。
二、如何获取到全国的所有公司名?
我面试过很多爬虫程序员,很多人都告诉我他曾经爬取过全国的所有公司。我非常喜欢问他们是怎么样获取的全国公司名录,每个人回答的都天花乱坠,实际真正遍历出全国公司的选手少之又少。
问:你是如何在项目中遍历出全国公司的?
三、我们获取公司名称的平台渠道有哪些?
国家企业信用信息公示系统
天眼查
企查查
还有很多很多,不一一列举。
四、我们如何获取到全国公司名称?
该问题以天眼查为例回答
脑洞时间
- 1.对方数据库主键是不是自增的,我是不是可以通过累加ID来试试?
sample:
https://www.tianyancha.com/company/2318455639
oh shit!还真的是数字的,那么我是不是可以通过数字累加来解决,那么累加后数据如下
https://www.tianyancha.com/company/2318455640
https://www.tianyancha.com/company/2318455641
https://www.tianyancha.com/company/2318455642
https://www.tianyancha.com/company/2318455643
https://www.tianyancha.com/company/2318455644
https://www.tianyancha.com/company/2318455645
...
通过测试我们发现累加后是有部分404的,而且我们不知道累加的数字的初始是从哪里开始。
而且数字是从十亿开始的那么我要从0开始累加到十亿么?
- 2.我是不是可以通过搜索穷举注册号来获取到全国的公司?
我们都知道注册号由15位数字构成,比如阿里巴巴的注册号为:330100400013364。
那我是不是可以通过注册号的自增来获取呢?
- 3.我是不是可以通过地址属性来获取全国公司名?
一个公司注册后,必定会有的一个属性就是地址。
地址又可以拆分为:省、市、区/县、镇、街道等属性。
所以我们可以通过遍历全国省市区来获取到全国的工商数据。
我是如何获取全国公司及企业信息的?
我使用爬虫技术,将全国工商信息想象成一课巨大的树。每一个省是这棵树的主干,省下边每一个市是二级枝干,区县为三级枝干,乡镇为第五级枝干。我通过遍历的方式最终获取到1.1E条公司名称。
又通过这些公司名称,去请求公司详情页,最终获取到完整的工商数据。
获取到全国公司名称后能做什么?
获取到全国公司名称后能区分哪些是做服装行业的、哪些是做运输行业的、哪些是做外贸行业的。
这样就可以精准营销客户啦。
下一篇:
如何获取全国外贸公司。
本文章中所有内容仅供学习交流,不可用于任何商业用途和非法用途,否则后果自负,如有侵权,请联系作者立即删除!
技术交流联系QQ:278147972