数据挖掘r语言和python知乎_同时用R语言和Python爬取知乎美图

本文作者杜雨展示了如何使用R语言和Python分别爬取知乎上的图片。通过R的rvest和downloader库,以及Python的requests、BeautifulSoup等库,实现了图片的抓取和下载。详细代码和步骤都在文中给出。
摘要由CSDN通过智能技术生成

作者:杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。

学习Python已有两月有余,是时候检验下学习效果了,之前练习了不少R语言数据爬取,Python的爬虫模块还没有来得及认真入门,乱拼乱凑就匆忙的开始了,今天就尝试着使用R+Python来进行图片爬取,完成一个简单得小爬虫。

目标网址在这里:

https://www.zhihu.com/question/35931586/answer/206258333

R语言版:

library(rvest)

library(downloader)

url

link% html_nodes("div.RichContent-inner>span")%>%

html_nodes("img")%>%html_attr("data-original")%>%na.omit

#借助Chrome的审查元素功能,借助其路径copy功能精准定位图片所在节点

link

Name

dir.create("D:/R/Image/zhihu/zhihu0807")             #建立存储文件夹

setwd("D:/R/Image/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值