信息渠道,企业范围
感觉更多的涉及到的是自然语言处理,处理海量信息得到需要的内容
还要考虑一些企业是在内部OA系统发布的招标公告



招标网站

政府网站
- 只支持查询单个企业的信息
- 搜索范围有一定的要求

- 不能进行爬虫,因为是政务网站,爬虫违法
第三方网站得到名录(天眼查、企查查)

- 思路:从这几家网站中获取企业名录缩小企业范围之后在指定域名范围进行信息检索
- 专业版支持,所以是付费操作
海量数据检索筛选
- 很复杂,代价大(检索范围广)
- 涉及到自然语言处理训练模型筛选误差也很大
其他
网上有关此方面自动化的均是在招标网站上实现的爬虫