R语言实战应用案例精讲
文章平均质量分 83
多掌握一门语言,你就多一份生存的技巧
优惠券已抵扣
余额抵扣
还需支付
¥19.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
普通网友
这个作者很懒,什么都没留下…
展开
-
R语言实战应用精讲50篇(二十四)-贝叶斯定理及R语言实现
贝叶斯方法是可信度的先验分配与以数据为条件的可信度的后验再分配之间的数学关系。1贝叶斯规则托马斯·贝叶斯 Thomas Bayes(1702-1761)是英国的数学家。Bayes统计推断理论于1763年出版(An Essay Toward Soolving a Problem in the Doctrine of Chances)。这个简单的规则对统计推论有着巨大的影响,贝叶斯的继任者皮埃尔-西蒙·拉普拉斯(1749-1827年)重新发现并广泛开发了bayes方法。目前,在欧美等西方国家,贝叶斯统原创 2022-06-20 05:30:00 · 1768 阅读 · 0 评论 -
R语言实战应用精讲50篇(三十六)-数据可视化从基础到高级
ggpubr包实现均值水平比较检验与显著性标记图示主要介绍ggpubr包。library(ggpubr)head(ToothGrowth)table(ToothGrowth$supp)table(ToothGrowth$dose)table(ToothGrowth$supp, ToothGrowth$dose)compare_means(len ~ supp, data = ToothGrowth)compare_means(len ~ supp, data = ToothGrow原创 2022-02-15 03:30:00 · 1396 阅读 · 0 评论 -
R语言实战应用精讲50篇(三十五)-R语言实现xgboost回归(附R语言代码)
xgboost回归采用xgboost包构建xgboost模型有一个比较棘手问题在于构建xgb.DMatrix数据,同时为了应用提前终止策略需要构建watchlist,以下代码从数据准备部分开始对上面两部分内容均有覆盖,大家可以参考使用。 # 数据准备colnames(boston)# 训练原创 2022-02-08 03:45:00 · 4431 阅读 · 2 评论 -
R语言实战应用精讲50篇(三十四)-曲线分离实战应用案例(附R语言代码)
1引言 在现实环境中,我们有许多时间序列数据,比如超市零售数据,可能同时包括成千上万种商品的销量历史数据。不同商品销量随时间会有不同的变化。如果需要对销量进行预测,首先就应该根据趋势,对商品进行分类。然后对同一类的商品建立相同的模型,当然模型的参数略微有些不同。 似乎很少见到根据曲线趋势进行分类的例子,如何评价曲线的趋势?这是一个问题。我们首先应该想到,相关系数可以评价2个曲线之间的相关程度。同一类曲线之间,应该具有较高的相关系数。因此,我们可以先计算曲线之间的相关系数, 构成相关矩阵,然后转.原创 2022-02-16 04:00:00 · 1584 阅读 · 0 评论 -
R语言实战应用精讲50篇(三十二)-R语言实现单变量时间序列(附R语言代码)
常用时间序列分析包和时间序列数据格式#包library(xts)library(quantmod)library(fBasics)library(urca)library(FinTS)library(forecast)library(rugarch)########################################3、R语言中的时间序列——ts格式#R环境中生成数据set.seed(42)data1 <- rnorm(50)data1#使用...原创 2022-04-02 06:00:00 · 1564 阅读 · 0 评论 -
R语言实战应用精讲50篇(三十一)-R语言实现决策树(附R语言代码)
决策树回归首先采用rpart包的rpart函数训练决策树模型,需要指定公式、数据集,将模型设定为回归模型,也就是将method设定为anova,最后是控制参数,主要是一些控制决策树生长的预剪枝参数,包括设定树的深度、叶子节点样本量、复杂度参数等,具体可以查阅函数帮助文档。其次输出前述模型的结果,即初始树,同时输出复杂度相关表格和图形。依据这些表格和图形可以确定一个最佳的cp值,进而进行下一步后剪枝。经过后剪枝的决策树,也就是我们最后确定下来的决策树模型,用于后续的输出和预测。最后输出决策原创 2022-05-19 05:00:00 · 2499 阅读 · 0 评论 -
R语言实战应用精讲50篇(三十)-R语言实现支持向量机(附R语言代码)
支持向量机回归以下是构建公式、构建svm回归模型、输出模型概况的代码。主要是采用as.formula将因变量、自变量拼接到一起构建为公式,然后采用e1071包的svm函数训练支持向量机模型,其中核函数采用高斯核。# 因变量自变量构建公式colnames(boston)form_reg <-as.formula(paste0("medv ~ ", paste(colnames(traindata)[1:13], collapse =" + ")))form_reg# ...原创 2022-05-17 05:00:00 · 1922 阅读 · 0 评论 -
R语言实战应用精讲50篇(二十九)-数据可视化应用案例(附R语言代码)
条形图、饼图、treemap及其局部调整# 条形图、饼图、树形图及其局部调整library(tidyverse)mtcars %>%mutate(cyl = as_factor(cyl)) %>%ggplot(aes(x = cyl)) +geom_bar()mtcars %>%mutate(cyl = as_factor(cyl)) %>%ggplot(aes(y = cyl)) +geom_bar()library(janit...原创 2022-01-25 06:00:00 · 1966 阅读 · 0 评论 -
R语言实战应用精讲50篇(二十八)-大量代码示例带你从基础到高级(附R语言代码)
入门知识主要介绍R语言相关软件安装与设置,相关资料网站,包的安装、加载、更新、移除等管理操作,帮助获取,工作目录的查看与设置,代码相关文件,内置数据加载等内容。#############################################################################################################R、RStudio安装#https://mirrors.ustc.edu.cn/CRAN/#http...原创 2022-01-23 06:00:00 · 1257 阅读 · 0 评论 -
R语言实战应用精讲50篇(二十七)-R语言实现随机森林(附R语言代码)
随机森林回归回归问题指的是因变量或者被预测变量是连续性变量的情形,比如预测身高体重的具体数值是多少的情形。整个代码大致可以分为包、数据、模型、预测评估4个部分,接下来逐一解读。1、包部分,也就是加载各类包,包括随机森林包randomForest,数据相关包tidyverse、skimr、DataExplorer,模型评估包caret。2、数据部分,主要是读取数据,处理缺失值,转换变量类型。3、模型部分。为了对模型的泛化能力有更准确的评估,先将数据集拆为训练集和测试集,后续将在训练集上训练原创 2022-01-17 06:00:00 · 5251 阅读 · 0 评论 -
R语言入门系列-软件下载,环境搭建,数据导入导出
1. 为什么是R?现在数据科学,深度学习领域最受欢迎的是Python, 那么为什么要学习R语言,Python 和 R 的优势分别在哪儿?简单来说,R语言更适用与研究,偏数理统计,小而精,适合将来做科研学术。Python更适用于工业领域,普适性,通用性,计算性能更好,更适合做程序员或者进入企业。所以首先需要确定自己的需求,R不一定适合每一个人。如果你是想认真学习编程思维,底层逻辑,那么R并不是一个很好地选择。但如果你只是需要一个工具,来帮你实现问题的分析,建模,解释和展示,那么R是一个很好地选择。原创 2022-01-01 06:00:00 · 1199 阅读 · 1 评论 -
R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程
1. 数据分析的开端,Tidyverse?tidyverse 是一个清晰的 R 包集合,在数据操作、探索和可视化领域提供统一的数据科学解决方案,这些解决方案具有共同的设计理念。它是由 RStudio 背后的首席科学家 Hadley Wickham 创建的。tidyverse 中的 R 包旨在提高统计学家和数据科学家的工作效率。包引导他们完成工作流程,促进沟通并产生可重复的工作产品。tidyverse 本质上侧重于使工作流成为可能的工具的互联。在数据科学项目中采用 tidyverse有很多优势。它提供一致原创 2021-12-28 06:00:00 · 1803 阅读 · 2 评论 -
R语言实战应用精讲50篇(三十)-R语言ggplot2绘制精美高级地图
本文主要特点 使用sfpackacke 并通过geom_sf()函数将其集成到ggplot2中,现在可以更轻松地快速创建专题地图。 这篇文章不仅展示了如何生成一个简单的单变量 choropleth(主题地图的另一种说法,其中(填充)颜色用作主要视觉变量),还展示了如何将两个变量组合成一个双变量色标。 它使用geom_tile()为双变量色阶引入了一个合适的图例。 它展示了如何添加解释空间模式的注释。 大纲本教程结构如下: 读入专题数据和地理数据。...原创 2022-05-16 05:00:00 · 2030 阅读 · 0 评论 -
R语言实战应用精讲50篇(二十九)-R语言算法应用案例:路径路网轨迹绘图分析(英国自行车数据库)
前言本文从多个角度讲解ggplot2的使用,包含调整坐标轴、调整标题、调整图例、调整背景/网格线/边距、分面图等内容,由浅入深,附带大量的案例和代码,希望能帮助到各位小伙伴。科研绘图细节调参ggplot介绍ggplot2 是一个绘图包,可以轻松地从数据框中的数据创建复杂的绘图。它提供了一个更具编程性的界面,用于指定要绘制的变量、它们的显示方式以及一般的视觉属性。因此,如果基础数据发生变化或者我们决定从条形图更改为散点图,我们只需要进行最少的更改。这有助于以最少的调整和调整创建出版质量的图。原创 2021-12-19 06:30:00 · 1691 阅读 · 0 评论 -
R语言实战应用精讲50篇(二十八)-R语言时空数据分析实战案例-数据处理及可视化
1.数据整理时空建模和预测通常涉及大量数据,这些数据以各种形式提供给用户,但通常以 CSV 文件或文本文件中的表格形式提供。通常会花费大量时间来加载数据并对其进行预处理,以便将它们转化为适合分析的形式。R 中有几个包可以帮助用户快速实现这些目标;在这里,我们专注于使用tidyverse工作流处理删失,它们包含特别适合所需数据操作技术的函数。我们首先加载所需的包,以及 STRbook(访问 https://spacetimewithr.org 获取有关如何安装 STRbook 的说明)library原创 2021-12-18 06:00:00 · 3220 阅读 · 1 评论 -
R语言实战应用精讲50篇(二十七)-时空数据分析-经验空间/时间均值(latex公式+R代码绘图)
前言数据可视化无疑是探索性数据分析的一个重要且必要的组成部分。此外,我们经常希望根据一阶(first-order)和二阶(second-order)特征的总结来探索时空数据。在这里,我们考虑经验均值(empirical means)和经验协方差(empirical covariances)的可视化、时空协变函数和半变异函数(spatio-temporal covariograms and semivariograms)、经验正交函数(empirical orthogonal functions)的使用及原创 2021-12-24 06:00:00 · 1882 阅读 · 0 评论 -
R语言问题剖析20篇(二)-什么是时空数据分析?意义、目标、模型
目前,时空数据已成为数据挖掘领域的研究热点,在国内外赢得了广泛关注。同时,时空数据挖掘也在许多领域得到应用,如交通管理、犯罪分析、疾病监控、环境监测、公共卫生与医疗健康等。时空数据挖掘作为一个新兴的研究领域,正致力于开发和应用新兴的计算技术来分析海量、高维的时空数据,发掘时空数据中有价值的信息。本文目录 1.什么是时空数据? 2.为什么要进行时空数据分析? 3.为什么时空模型应该是统计模型? 4.时空统计模型的目标 5.分层统计模型(Hierarchical原创 2022-05-30 05:00:00 · 946 阅读 · 0 评论 -
R语言实战应用精讲50篇(二十六)-数据可视化ggplot2-检验变量相关性图
本文介绍的图主要有助于检查两个变量的相关程度。共涉及图形包括: 1.散点图 Scatterplot 2.带环绕的散点图 Scatterplot with Encircling 3.抖动图 Jitter Plot 4.计数图 Counts Chart 5.气泡图 Bubble Plot 6.边际直方图/箱线图 Marginal Histogram / Boxplot 7.相关图 Correlogram 1.散点图 Scatterplot原创 2022-03-17 06:00:00 · 1181 阅读 · 0 评论 -
R语言实战应用精讲50篇(二十五)-时空数据统计模型:确定性预测模型
前言本章的主要目的是详细讨论时空统计建模的三个目标: 在给定时空数据的空间新位置进行预测 用时空数据进行参数推断 预测未来的新值 我们还强调了在我们的预测、参数估计和预测中量化不确定性的重要性。我们证明了时空预测的确定性方法是明智的,因为它们通常遵循 Tobler 定律,并在空间和时间上给予附近观测更多的权重;然而,它们不提供预测不确定性的直接估计。然后,我们表明可以使用具有时空数据的(线性)回归模型,并且只要残差不具有时空依赖性,就很容易获得统计上的最优预测,并且可能获得原创 2021-12-30 05:30:00 · 1906 阅读 · 0 评论 -
R语言实战应用精讲50篇(二十三)-贝叶斯理论重要概念: 可信度Credibility, 模型Models, 和参数Parameters
本章的目标是介绍贝叶斯数据分析的概念框架。贝叶斯数据分析有两个基本思想: 第一个想法是贝叶斯推理是在可能性之间重新分配可信度。 第二个基本思想是,我们分配可信度的可能性是有意义的数学模型中的参数值。 1贝叶斯推理是在可能性之间重新分配可信度制作图 1 的第一步是将数据对象放在一起,我们使用tidyverse包。library(tidyverse)d<-crossing(iteration=1:3,stage=fact......原创 2022-06-24 05:00:00 · 873 阅读 · 0 评论 -
R语言实战应用精讲50篇(二十二)-时空数据统计模型-时空克里格法(Spatial-Temporal Kriging)
本文的主要目标: R语言实现时空克里格法(Spatio-Temporal Kriging) 通用时空克里格法预测结果绘图 通用时空克里格法预测标准差结果绘图 尽管时间是一维向前的,但回顾一段时期内目标观测的变化也是很有价值的。我们可以用空间-时间均值和协方差函数来描述空间和时间的相互作用,而不必致力于建立一个动态表达相互作用的机械模型。在本中我们使用"描述性"方法的时空模型。我们明确区分了数据和代表测量所依据的现实世界过程的基本潜在过程( the underlying原创 2022-05-31 05:00:00 · 1559 阅读 · 0 评论 -
R语言问题剖析20篇(一)-R语言泛函式编程purrr实现优雅循环迭代
1总述在许多其他编程语言中,for 循环是非常重要的。然而,R是一种函数式编程语言,这意味着R有能力 "将for循环包裹在一个函数中,并调用该函数而不是直接使用for循环"。熟悉R语言的人都很熟悉基础R中的apply系列函数(即apply(),vapply(),lapply())。这些函数虽然非常有用,但在实际应用中可能不一致,会使得理解/使用很困难。引用张敬信老师的说法: " 用 R 写 「循环」 从低到高有三种境界:手动 for 循环,apply 函数族,purrr 包泛函式编程。..原创 2021-12-16 06:00:00 · 1578 阅读 · 0 评论 -
R语言实战应用精讲50篇(二十)-R语言时间序列预测模型:ARIMA vs KNN
1总述要找到一个合适的模型来预测时间序列数据总是很困难。其中一个原因是,使用时间序列数据的模型往往会暴露出序列相关性。在这篇文章中,我们将比较 经典的随机过程--自回归移动平均(ARIMA)。 k近邻(KNN)回归(一种有监督的机器学习方法) 数据集a101991年至2008年澳大利亚每月的抗糖尿病药物补贴。作为药品福利计划的一部分,澳大利亚健康保险委员会记录的属于ATC代码A10的产品的每月政府支出(百万美元)。 时间:1991年7月至2008年6月。原创 2021-12-15 06:00:00 · 2212 阅读 · 0 评论 -
SPSS实战应用案例50篇(一):从SPSS的角度讲清楚卡方检验
前言 卡方检验(Chi-square test)用于比较观察数与理论数的吻合程度,也称为拟合优度。实际应用中,比较几组频率或者构成是否相同,也用于分类变量的关联分析。利用SPSS的交叉表过程可以做卡方检验。本文介绍的卡方检验所用例子,设计类型为独立设计,或称完全随机设计,其观察结果独立。而有些时候,观察结果并不独立。比如一些人,同时用影像学方法检查与检查标记物指标诊断某种疾病,此时两种检查结果可能并不完全一致。这种设计称为配对设计,所使用的卡方检验称作McNemar卡方检验。这类数...原创 2021-12-13 06:00:00 · 9080 阅读 · 0 评论 -
R语言实战应用精讲50篇(十九)-R语言gganimate函数应用案例:静态图变成动态,让你的图表更酷炫
前言gganimate包可以让ggplot2做出来的各种图形变成动态,今天我就以时间序列图为例,让时间序列数据动起来!library(gganimate)时间序列动态图主要用的函数是transition_time()1.查看数据?airquality该数据共有153个观测,6个变量,每个变量的含义如下:2.时间序列点图anim<-ggplot(airquality,aes(Day,Temp))+geom_point(aes(colou...原创 2021-12-12 06:00:00 · 1419 阅读 · 0 评论 -
R语言实战案例-蒙特卡罗方法(附实现代码)
蒙特卡罗模拟已成为衍生证券定价和风险管理的重要工具,这些应用反过来刺激了对新的蒙特卡罗方法的研究,并重新引起了人们对某些旧有技术的兴趣。Monte Carlo simulation has become an essential tool in the pricing of derivative securities and in risk management. These applications have, in turn, stimulated research into new Monte原创 2021-11-18 06:15:00 · 4001 阅读 · 0 评论 -
R语言实战小案例-画相关矩阵图案例
本期使用R语言内置数据集进行练习;查看R包含哪些内置数据,请使用“data()”函数:我们使用这里面的“mtcars”数据,包含“mpg”、“cyl”、“disp”、“hp”、“drat”等11个变量的汽车道路测试数据;在R中读取内置数据,直接输入数据名称即可:corrplot包# 安装corrplot包并调用install.packages("corrplot")library(corrplot)第1种:简单粗暴蓝色表示两个变量呈正相关,红色表示变量呈负相关原创 2021-11-19 06:00:00 · 2617 阅读 · 0 评论 -
R语言实战应用精讲50篇(十八)-R语言实现分词、词频与词云案例解析
“包”治百病我真的超爱R语言,原因之一就是R有许多已经写好、“开箱即用”的程序包(有关R语言程序包的详细介绍,可以阅读我之前的推送“一起来学R│4-包的安装与调用”)可以直接拿来用;要知道,程序包减少了多少工作量呀。当然,其他语言也有类似的包,但是貌似没那么多、没那么细。这一期咱就要用jiebaR包、sqldf包和wordcloud2包完成中文文本的分词、词频统计与绘制词云图的工作。首先设置工作目录:可以通过R-Gui的“文件-改变工作目录”菜单完成,也可以通过以下代码;设置工作目录的意义是,你的所.原创 2021-10-31 06:00:00 · 2049 阅读 · 0 评论 -
R从网页抓取到文本分析全教程:影评的获取与分析
本期介绍使用爬虫技术抓取网页,及对获取的网页文本数据做后续分析的实战案例。我将以网友对《流浪地球》豆瓣影评文本的获取与分析全过程,作为演示案例。文本挖掘的本质是,通过自然语言处理(Natural Language Processing,NLP)和分析方法,将文本转化为数据进行分析。因此,阅读本文,需要一定的知识基础,包括网页设计、自然语言处理方法,我会在文中适当补充。➡ 1.准备工作分析工作之前,需要为软件配置工作环境,包括设置工作目录、调用需要的程序包等等。采集到的文本数据、各类.原创 2021-10-28 06:00:00 · 1576 阅读 · 0 评论 -
R语言实战应用精讲50篇(十七)--使用R语言实现时间序列分析
方法简介时间序列是按时间顺序的一组数字序列。时间序列分析(time series analysis)就是利用这组数列,基于随机过程理论和数理统计学方法加以处理,以预测未来事物的发展。时间序列分析是定量预测方法之一,它的基本原理:一是承认事物发展的延续性。应用过去数据,就能推测事物的发展趋势;二是考虑到事物发展的随机性。任何事物发展都可能受偶然因素影响,为此要利用统计分析中加权平均法对历史数据进行处理。时间序列预测一般反映三种实际变化规律:趋势变化、周期性变化、随机性变化。时间序列分析一般采用曲线.原创 2021-10-26 06:00:00 · 2918 阅读 · 1 评论 -
SPSS实战应用案例50篇(一)-如何使用SPSS进行时间序列分析
1数据处理定义日期首先,点击“数据-定义日期”。接着,在弹出的“定义日期”对话框内,设置日期的格式。在本期演示中选择“年份、月份”作为日期格式。确定日期格式后,“数据视图”可以看到新插入的日期“Year”“Month”“Date”(新变量默认名称):平稳性判断绘出序列图后,平稳时间序列不需要这一步处理。点击“分析-预测-序列图”,绘制伊利湖水位数据的时间序列图:从上图可以初步判断,伊利湖水位50年来呈现出非平稳趋势。但这仅是从时序图上的直观判断,还要从该序列的自相关函原创 2021-10-27 06:00:00 · 5948 阅读 · 0 评论 -
R语言应用实战-基于R的C4.5算法和C5.0算法原理解析及应用案例
前言决策树方法在分类,预测,规则提取等领域有着广泛的应用。决策树是一种树状结构,它的每一个叶节点对应着一个分类,非叶结点对应着属性上的划分,根据样本在该属性上的不同取值将其划分若干个子集。对于非纯结点,多数类的标号给出达到这个结点的样本所属的类。构造决策数的核心问题是在每一步如何选择适当的属性对样本做拆分。对一个分类问题,从已知类标记的训练样本中学习并且构造出决策树是一个自上而下,分而治之的过程。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLA原创 2021-08-27 08:16:46 · 1320 阅读 · 0 评论 -
R语言应用实战-基于R语言的综合评价(层次分析法AHP为例)
一.综合评价的基本概念对一个事物的评价往往会涉及多个因素或者多个指标,评价是在多个因素相互作用下的一个综合判断。多指标综合评价方法具有以下的特点:包含若干个指标,分别说明被评价对象的不同方面,评价方法最终要对被评价对象作出一个整体性的评判,用一个总指标来说明被评价对象的一般水平。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLAB-30天带你从入门到精通MATLAB深入理解高级教程(附源码)tableau可视化数据分析高级教程那么评价原创 2021-08-26 08:26:58 · 2982 阅读 · 0 评论 -
R语言应用实战-基于R语言的典型相关分析
一.基本概念和原理典型相关分析中,当一组变量仅有两个时,可用简单相关系数衡量;当考察一组时,可用复相关进行衡量。大量的实际问题需要我们把指标之间的联系扩展到两组随机变量之间的相互依赖关系。典型相关关系就是为了解决此类问题而提出的多变量统计分析方法。它实际上是利用主成分的思想来讨论两组随机变量的相关性问题,把两组变量间的相关性研究化为少数几对变量间的相关性研究,而且这少数几对变量之间又是不相关的,以此来达到化解复杂相关关系的目的。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我原创 2021-08-31 08:15:34 · 3576 阅读 · 0 评论 -
R语言实战应用-基于R语言的对应分析
一.基本概念和原理对应分析(Correspondence Analysis)是在因子分析的基础上发展起来的,对应分析是多变量统计分析中有用的分析方法。对应分析把R型和Q型因子统一起来,通过R型因子分析直接得到Q型因子分析的结果,把变量(指标)和样品同时反映到相同的坐标轴(因子轴)的一张图上,用此来说明(指标)与样品之间的关系。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLAB-30天带你从入门到精通MATLAB深入理解高级教程(附源码)原创 2021-09-02 08:18:45 · 2876 阅读 · 0 评论 -
R语言应用实战-基于R的因子分析(以上市公司数据为例)
一.概念和原理因子分析法是从研究变量的内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同变量之间的相关性比较低,那么每一类变量实际上就代表一只基本结构,即公共因子。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLAB-30天带你从入门到精通MATLAB深入理解高级教程(附源码)tableau可视化数据分析高级教原创 2021-08-28 05:47:09 · 3052 阅读 · 0 评论 -
R语言应用实战-聚类分析以及k-means的优缺点
一.聚类概念聚类分析cluster Analysis)是研究物以类聚的现代统计方法。在过去是依靠经验和专业知识做定性分析处理,很少利用数学方法多元统计分析逐渐被引进数值分类,形成聚类分析的分支。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLAB-30天带你从入门到精通MATLAB深入理解高级教程(附源码)tableau可视化数据分析高级教程思想:认为所研究的样本或指标(变量)之间存在着不同程度的相似性(亲疏关系)。于是根据一批样本的原创 2021-09-03 08:14:30 · 1655 阅读 · 0 评论 -
R语言应用实战-基于R语言的判别分析:fisher判别法,距离判别法以及Bayers判别法(附源代码)
前言判别分析(Discriminat Analysis)是多变量统计分析中用于判别样本所属类型的一种统计分析法。它所要解决的问题是在一些已知研究对象用某种方法已经分成若干类的情况下确定新的样本属于已知类别的哪一类。判别分析在处理问题时,通常要给出一个衡量新样品与各已知类型接近程度的描述统计模型即判别函数,同时也指定一种判别规则,借以判定新的样本归属。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLAB-30天带你从入门到精通MATLAB深入理原创 2021-08-25 08:01:50 · 5462 阅读 · 0 评论 -
R语言应用实战-OLS模型算法原理及应用示例
前言变量之间的关系可以分为函数关系(有精确的数学表达式)和相关关系可以分为:平行关系(一元回归分析),依存关系(多元回归分析)。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLAB-30天带你从入门到精通MATLAB深入理解高级教程(附源码)tableau可视化数据分析高级教程今天就来总结一下ols模型一.ols模型需要满足四个假设:1.正态性,可以通过qqplot进行检验,看看是否分布在45度倾斜角的直线上2.独立性,可原创 2021-09-01 12:40:54 · 3084 阅读 · 1 评论 -
R语言应用实战-基于R浅谈SEIR传染病模型以以及马尔萨斯,logistic模型(推导过程和源代码)
前言关于传染病SEIR模型,接下来我们分为以下几块内容讨论:一传染病的数学模型原理,二.R语言代码实现,三.常见错误以及相关其他模型的讨论(马尔萨斯模型和logistic模型)。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLAB-30天带你从入门到精通MATLAB深入理解高级教程(附源码)tableau可视化数据分析高级教程一.SEIR模型原理:把人群分为四类分别为S,E,I,R类1、S 类,易感者 (Susceptible原创 2021-08-29 06:56:52 · 3172 阅读 · 0 评论