本文将用爬取B站上的视频标题为例介绍R语言网络爬虫入门。
防止中文显示乱码,设置系统语言为中文
Sys.setlocale("LC_ALL","Chinese")
加载rvest,tidyverse
library(rvest)library(tidyverse)
在bilibili上搜索nike
B站搜索nike的网址为 https://search.bilibili.com/all?keyword=nike&page=1
url="https://search.bilibili.com/all?keyword=nike&page=1"
读取这个URL的HTML
html read_html(url)