数据源:丁香园
* 基于丁香园官网数据,制作此次新型冠状病毒(2019-nCov)的疫情感染可视化图表
* 应用到的R语言包主要有:rvest&stringr(爬取数据并规整)、REmap(绘制地理密度图&迁徙图)、echarts4r(制作交互式图表,也可用ggplot2做可视化)
* 本文仅供进行技术交流,如有其他意见和建议还请评论或私信告知; 如有侵权请私信删除
* 未完待续。。。
基础数据爬取
library(REmap)
library(baidumap)
require(rvest)
require(magrittr)
library(dplyr)
library(tidyr)
library(stringr)
library(knitr)
library(ggplot2)
library(ggthemes)
library(echarts4r)
library(data.table)
library(downloader)
url <- 'https://3g.dxy.cn/newh5/view/pneumonia'
c <- read_html(url) %>%
html_nodes("#getAreaStat") %>%
html_text()
total_data <- read_html(url) %>%
html_nodes("#getStatisticsService") %>%
html_text()
total_info <- str_extract_all(total_data,'(?<=confirmedCount\\"\\:).+?(?=\\"virus)')
total_data <- data.frame(x = gsub('[^0-9]',' ',total_info )) %>%
separate(x, c('confirmedCount','suspectedCount','curedCount','deadCount')) %>%
mutate(id = 1:nrow(.)