R语言爬虫：当当图书畅销榜（近7日）

woooooood

于 2018-10-09 17:08:14 发布

阅读量1.3k

点赞数 2

分类专栏：学习记录文章标签： R 爬虫实例

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/woooooood/article/details/82985245

版权

时间：2018-10-9
爬取内容：当当图书畅销榜（近7日）：书名、作者、出版社、推荐率、出版时间、价格、折扣、网址

R语言爬虫：当当图书畅销榜（近7日）

通过对其他人爬虫代码的学习，发现有相当一部分人对的代码中出现了“%>%”等内容，不知其意。无意中发现该部分内容是magrittr包的管道操作，于是对其进行了学习，并在对当当图书数据的爬取中使用了该管道操作。（参考教程：R语言中管道操作）

代码所用到的函数如下：

函数	说明
read_html()	保存网页
html_nodes()	提取网页指定节点内容
html_text()	提取网页文本信息
str_match()	提取字符串中满足要求的部分
as.numeric()	将变量转为数值型
as.Date()	将变量转为日期型
data.frame()	生成数据框
html_attr()	提取网页指定属性内容

最低0.47元/天解锁文章

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
R语言爬虫：当当图书畅销榜（近7日）

时间：2018-10-9爬取内容：当当图书畅销榜（近7日）：书名、作者、出版社、推荐率、出版时间、价格、折扣通过对其他人爬虫代码的学习，发现有相当一部分人对的代码中出现了“%&amp;amp;gt;%”等内容，不知其意。无意中发现该部分内容是magrittr包的管道操作，于是对其进行了学习，并在对当当图书数据的爬取中使用了该管道操作。（参考教程：R语言中管道操作）代码所用到的函数如下：函数说明...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。