利用R通过顺企网根据公司名称爬取企业地址
有时我们有公司名称数据但是没有地址,需要根据公司名称找出企业的地址,描述其空间布局,如果数据量很大,手动在网页中操作费时费力,R语言提供了一个解决的办法,前提是该网站能够与机器交互(即没有反爬机制,或者有但限制较小)。其过程如下
1. 首先读取数据并作简单处理
打开顺企网检索某个公司
发现其链接是以下形式,其特征是字符串+“公司名称”构成了一个完整的链接

因此可以对每个公司名称构建url地址,然后根据url地址获取页面信息
#library packeges
> library