R手册(Import)--rvest

最新推荐文章于 2024-05-31 09:51:25 发布

WilenWu

最新推荐文章于 2024-05-31 09:51:25 发布

阅读量628

点赞数 1

分类专栏： R手册

本文链接：https://blog.csdn.net/qq_41518277/article/details/80158123

版权

R手册专栏收录该内容

40 篇文章 11 订阅

订阅专栏

文章目录

解析html
提取组件
提取，修改和提交形式的函数
浏览网站

解析html

函数	说明
read_html(x, …, encoding = “”)	x为a url或 a local path
html_nodes(x, css, xpath)	通过使用 XPath and css ，selectors`( read vignette("selectorgadget")` to learn about it)选择文档的一部分

提取组件

函数	说明
html_text(x)	提取标签内的文本
html_attr (x,name)	提取单个属性的内容，如href超链接
html_attrs(x)	所有属性
html_tag(x)	标签名
html_table()	Parse html tables into data frames

for XML: read_xml , xml_node, xml_attr, xml_attrs, xml_text and xml_tag

提取，修改和提交形式的函数

 html_form()
 set_values() 
 submit_form()

浏览网站

html_session()
jump_to()
follow_link()
back(), forward()
submit_form()
# and so on

Examples

lego_movie <-read_html("http://www.imdb.com/title/tt1490017/")
rating <- lego_movie %>%
  html_nodes("strong span") %>%
  html_text() %>%
  as.numeric()

WilenWu

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
R手册(Import)--rvest

爬虫rvest1. 解析html2. 提取组件3. 提取，修改和提交形式的函数4. 浏览网站rvest1. 解析html 函数说明 read_html(x, …, encoding = “”) x为a url或 a local path html_nodes(x, css, xpath) 通过使...
复制链接

扫一扫

专栏目录