DV_Final_大数据专业 期末 R语言考试 全部 内容

  1. 数据观察和预处理。读取数据可使用 read.csv()函数或 readr 包中的
    read_csv()函数;数据预处理操作包括时间类型的转换,可使用 as.Date()函数;长
    宽数据的转换,将数据集 2 转换为长数据;日期中年月日的提取等。还可进行分
    组汇总计算,例如根据累计确诊人数计算 2020 年 1 月 3 日至 2022 年 12 月 7 日
    的国内各省每日新增确诊人数,按年月分组汇总确诊人数等。
library(tidyverse)

### 读取数据
# 全球新冠肺炎疫情数据
a <- read_csv("WHO-COVID-19-global-data.csv")
# 全国新冠肺炎累计确诊数据(带地理坐标)
b <- read.csv("con_20221207_v3.csv")
# 全球新冠肺炎累计确诊数据(带地理坐标)
c <- read.csv("con_20221207_v0.csv",)

### 筛选数据
# 筛选11月30日全球新冠肺炎数据
a %>%
  filter(Date_reported == '2022-11-30') -> data1

# 删除累计确诊和累计死亡人数为0的国家
# 否则对数值无法计算(log(0))
data1 %>%
  filter(Cumulative_cases!=0 & Cumulative_deaths !=0) -> data1_new
# 对数处理
data1_new$log_cumcases <- log10(data1_new$Cumulative_cases+0.9)
data1_new
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mrrunsen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值