R 语言爬取北京的天气分析

Mrrunsen

已于 2023-09-02 20:27:00 修改

阅读量182

点赞数

分类专栏： R语言大学作业文章标签： r语言开发语言

于 2023-09-02 20:25:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Mrrunsen/article/details/132642246

版权

R语言大学作业专栏收录该内容

1394 篇文章 6119 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

天气网北京历史天气链接页：https://lishi.tianqi.com/beijing

library(tidyverse)
library(rvest)

从网页解析出来 url

postfix = read_html("https://lishi.tianqi.com/beijing/index.html") %>% 
  html_elements("a") %>% 
  html_attr("href") %>%                                         # 解析网址
  str_subset("^/beijing")                                       # 筛选出正确的
urls = str_c("http://lishi.tianqi.com/", postfix)
urls[1:10]

从网页解析历史天气数据

weather = read_html(urls[1]) %>%              # 2022年11月                         
    html_nodes(".thrui") %>% 
    html_text2()  

weather

结果是一个大字符串，犹如乱码。

借助正则表达式+tidyverse，清洗成整洁数据框

分割成多行，一个样本一行

每一行再分割成多列

tibble(weather) %>%

了解本专栏

超级会员免费看

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
R 语言爬取北京的天气分析

天气网北京历史天气链接页：https://lishi.tianqi.com/beijing从网页解析出来 url从网页解析历史天气数据结果是一个大字符串，犹如乱码。借助正则表达式+tidyverse，清洗成整洁数据框分割成多行，一个样本一行每一行再分割成多列。
复制链接

扫一扫

专栏目录

Mrrunsen CSDN认证博客专家 CSDN认证企业博客

码龄3年

1728: 原创

8859: 周排名

887: 总排名

185万+: 访问

: 等级

1万+: 积分

8974: 粉丝

623: 获赞

267: 评论

4631: 收藏

私信

关注

热门文章

分类专栏

最新评论

使用R语言做XGBoost模型的超参数调整和十折交叉验证，需要建好模型得到R2和RMSE即可。
2301_82041190: > library(xgboost) > # 读入数据 > data <- mtcars > # 将数据分为特征和标签 > X <- as.matrix(data[, -1]) > y <- data$mpg > library(caret) > param_grid <- expand.grid( + nrounds = c(100, 200), + max_depth = c(4, 8), + eta = c(0.01, 0.1), + gamma = 0, + colsample_bytree = c(0.7, 0.8), + min_child_weight = c(1), + subsample = c(0.7) + ) > # 设置控制参数 > ctrl <- trainControl(method = "repeatedcv", number = 10, repeats = 1, verboseIter = TRUE) > # 开始网格搜索 > xgb_train <- train( + x = X, + y = y, + method = "xgbTree", + tuneGrid = param_grid, + trControl = ctrl, + verbose = TRUE + ) Error in UseMethod("train") : no applicable method for 'train' applied to an object of class "c('matrix', 'array', 'double', 'numeric')" 为什么会报这个错误啊
用R来做一个临床研究亚组分析的森林图
何呼呼: 森林图
R语言画中国地图-新方法
2401_82793706: 求省份xls
R语言绘图保存的pdf图片无法显示中文怎么办？
pao_1_abc: 我按照两个方法都试了，还是不行？请问还有别的办法吗
R语言广义相加模型 (GAMs)分析预测 AirPassengers 时间序列数据
2301_82327411: 作者你自己看看这写的什么东西啊

大家在看

PyTorch的模型定义方法 1715

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mrrunsen 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。