目录
15种工商数据的采集方法
如何收集工商数据,来实现数据分析、AI数据训练、数据拓客使用,是目前所有人面临的一个技术问题。如果市场上有个技术或者有个工具可以聚合这些数据的话,我觉得将会促进大数据+AI的发展。数据采集根据采集数据的类型可以分为不同的方式,主要方式有:传感器采集、爬虫、录入。对于新闻资讯类、行业互联网和政府开放的数据,可以通过编写网络爬虫,设置好数据源后进行有目标性的爬取数据。下面是我对除了工商数据外,把平时大家接用比较多各种数据源的网址、开放类型、采集方法进行整理分类,希望可以帮助到大家快速找到时候自己的方法。
1、目前常用的15种数据网站
名称 | 种类 | 网址 | 公开方式 | 获取方式 |
工商网 |
工商信息 |
http://www.gsxt.gov.cn |
工商局免费公示 |
1.通过自己写python爬虫,自动爬取信息(需要采用图像识别技术识别处理验证码) 2、通过下载近探拓客这种工具自动采集 3、通过调用百度 阿里云那种接口付费 |
天眼查网 |
工商信息 |
http://www.tianyancha.com |
免费查询 会员收费下载 |
1.通过注册会员付费下载 2.通过写爬虫采集(模拟V |