html nodes id,r – 如何将xpath传递给html_nodes()？

最新推荐文章于 2021-07-03 04:01:40 发布

shul mate

最新推荐文章于 2021-07-03 04:01:40 发布

阅读量286

点赞数

文章标签： html nodes id

我想使用html_nodes从谷歌搜索结果中搜集组织的名称(我只需要第一个元素,假设这将是最好的猜测).

现在,我试图使用其xpath来定位第一个结果,并将其传递给函数html_nodes.

要查找xpath,我使用的是谷歌浏览器,如下图所示

这给了我* * [@ id =“rso”] / div [1] / div / div [1] / div / div / h3 / a作为第一个结果标题的xpath.但是,当我尝试将其传递给html_nodes()时,我得到一个空字符串：

page %>% html_nodes(xpath='//*[@id="rso"]/div[1]/div/div[1]/div/div/h3/a')

{xml_nodeset (0)}

虽然我期待字符串The A-Test 2017 Workshop.

如何使用xpath或css获取该标记的内容？

最佳答案在抓取网站时,

selectorgadget是一个很棒的工具.使用这个我可以确定使用谷歌搜索结果,可以使用以下css-tag找到所有标题：.r.

为了刮取结果,你可以使用这样的东西：

library(rvest)

# searching for `rstudio`

page

page %>%

html_nodes(".r") %>%

html_text()

#> [1] "RStudio – Open source and enterprise-ready professional software ..."

#> [2] "Download"

#> [3] "Download RStudio Server"

#> [4] "RStudio Server"

#> [5] "Shiny"

#> [6] "RStudio – Wikipedia"

#> [7] "RStudio - Wikipedia"

#> [8] "Datenrettung | R-Studio 8.3 Deutsch | Software zur Datenrettung ..."

#> [9] "GitHub - rstudio/rstudio: RStudio is an integrated development ..."

#> [10] "RStudio · GitHub"

#> [11] "R-Studio"

#> [12] "Install RStudio with R Server on HDInsight - Azure | Microsoft Docs"

您可以通过子集轻松找到第一个：

page %>%

html_nodes(".r") %>%

html_text() %>%

.[1]

#> [1] "RStudio – Open source and enterprise-ready professional software ..."

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
html nodes id,r – 如何将xpath传递给html_nodes()？

我想使用html_nodes从谷歌搜索结果中搜集组织的名称(我只需要第一个元素,假设这将是最好的猜测).现在,我试图使用其xpath来定位第一个结果,并将其传递给函数html_nodes.要查找xpath,我使用的是谷歌浏览器,如下图所示这给了我* * [@ id =“rso”] / div [1] / div / div [1] / div / div / h3 / a作为第一个结果标题的xpa...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。