爬取企业工商信息_爬取企查查--批发业企业的信息

c5426111792bbc27f90ae8d4d8599948.png

由于工作要求,需要爬取企查查中批发业的所有企业的详细信息,本来准备用最简单的八爪鱼来爬取,但发现八爪鱼的爬取很鸡肋,因此特地学习python爬虫,以下只是简单的爬取需要的信息,之后更复杂的爬取还需要不断加强。

一、查看robots协议

https://www.qichacha.com/robots.txt

User-agent: **
Allow: /
Sitemap: https://www.qichacha.com/sitemap.xml

表示该网站允许任何爬虫任意爬取其内容

二、确定想要爬取的内容

5b1d1b029d3ca2d7dcca074b4bc387cc.png

9c85b24de36a0ca9422f51f67d956138.png

想要爬取的内容为”批发与零售“大类下”批发业“中的各个企业的信息:包括企业名称、法定代表人、注册

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值