作者:杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。
学习Python已有两月有余,是时候检验下学习效果了,之前练习了不少R语言数据爬取,Python的爬虫模块还没有来得及认真入门,乱拼乱凑就匆忙的开始了,今天就尝试着使用R+Python来进行图片爬取,完成一个简单得小爬虫。
目标网址在这里:
https://www.zhihu.com/question/35931586/answer/206258333
R语言版:
library(rvest)
library(downloader)
url
link% html_nodes("div.RichContent-inner>span")%>%
html_nodes("img")%>%html_attr("data-original")%>%na.omit
#借助Chrome的审查元素功能,借助其路径copy功能精准定位图片所在节点
link
Name
dir.create("D:/R/Image/zhihu/zhihu0807") #建立存储文件夹
setwd("D:/R/Image/