利用R通过顺企网根据公司名称爬取企业地址
有时我们有公司名称数据但是没有地址,需要根据公司名称找出企业的地址,描述其空间布局,如果数据量很大,手动在网页中操作费时费力,R语言提供了一个解决的办法,前提是该网站能够与机器交互(即没有反爬机制,或者有但限制较小)。其过程如下
1. 首先读取数据并作简单处理
打开顺企网检索某个公司![](https://i-blog.csdnimg.cn/blog_migrate/270661603868f6c44a62f50f7899b15d.png)
发现其链接是以下形式,其特征是字符串+“公司名称”构成了一个完整的链接
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/0801f59d3edbeb5741f431cffae47a06.png)
因此可以对每个公司名称构建url地址,然后根据url地址获取页面信息
#library packeges
> library(readxl)
> library