R语言
文章平均质量分 60
梦想画家
开源软件爱好者,乐于博客分享,业余时间喜欢跑步和科幻,希望与意趣相投朋友一起学习交流。
展开
-
基于R语言理解Parquet文件格式
parquet特征后者支持有效存储、查询数据。假设有下列数据:如果存储为CSV文件,在R终端中看到的是文件存储格式的镜像,为行存储,可有效实现文件查询,如:只要定位到第二行并返回数据,另外追加行到数据集也很方便,仅需要在文件结尾增加一行。但如果想汇总age列数据,那么可能是低效的,因为需要变量每一行并确定那个值是age,再返回。parquet使用列存储,按列布局,列数据按顺序存储。使用该布局,执行下面查询也是不方便,但如果需要汇总所有age,则仅需要简单汇总第三行。读写parquet文件在R中,读原创 2023-02-24 13:58:19 · 1102 阅读 · 0 评论 -
介绍汉明距离及计算示例
汉明距离是以美国数学家理查德·汉明的名字命名的,他在1950年关于汉明码的论文中提出了该举例度量指标。它被广泛用于多个学科,如信息论、编码理论和密码学。举例:“karolin” 和 “kathrin” 两个字符串汉明距离为s 3 (差异字符有: r-t, o-h, l-r),1011100 和 1001000 汉明距离为 2 (不同二进制数为: 1-0 和 1-0)31738 和 32337 汉明距离为 3 (不同整数位: 1-2, 7-3, 和 8-7).汉明距离在解决很多问题中被证明是非常有用。例如原创 2022-07-03 15:43:24 · 5486 阅读 · 0 评论 -
K近邻分类算法实战教程
KNN算法中的k表示邻近数据结点的数量,其算法过程如下:选择邻近结点数量K计算出测试数据结点和K个最近结点的距离在这个K个距离中,对每个分类进行计数依据少数服从多数原则,将测试数据结点归入在K个点中占比最高的那一类对于KNN分类算法,两点的距离计算采用欧式距离。请看下图:假设数据集包括两类,分别为红色和蓝色表示。我们选择k为5,即基于欧式距离考虑5个最近结点,所以当测试新数据点时,5个结点,其中国三个蓝色、两个红色。则认为新数据点分类为蓝色。鸢尾花数据集(Iris)包括3种鸢尾(setosa, virgi原创 2022-06-26 20:54:46 · 670 阅读 · 0 评论 -
人工神经网络算法实战教程
ANN主要用于解决对人很容易但对机器很难的问题,如:识别猫狗图片、数字图片。这些问题通常也称为模式识别,广泛应用于光学字符识别(OCR, optical character recognition)、物体检测等。本文主要介绍ANN并通过R示例介绍其实现过程。1943年,沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮茨(Walter Pitts)建立了首个神经元数学模型。在他们的研究论文中,描述了神经元的简单数学模型,它代表了神经系统中接受输入、处理输入并返回输出的单个细胞,该模型被称为McC原创 2022-06-26 17:27:40 · 2938 阅读 · 0 评论 -
如何对类别变量进行独热编码
大部分机器学习算法是基于向量空间中度量来进行计算的,使用独热编码(One-hot encoding, 也称为哑变量 dummy variable)会让特征之间的距离计算更加合理。通过独热编码把类别变量转换为机器学习算法可使用的格式,其基本思想是对原始类别变量的每个值创建新的变量,并赋值为 1 和 0下图展示如何进行独热编码,把Team变量转为新的变量:下面把原始变量转为独热编码形式:R 有多种方式很容易实现独热编码。可以使用工具包提供函数实现,也可以手动实现。下面定义演示数据:我们先看caret包中提供原创 2022-06-16 21:11:46 · 2872 阅读 · 0 评论 -
R语言并行计算实战教程
%do% 和 %dopar% 是对遍历对象执行一段业务功能代码的操作。其中ex是表达式,在foreach循环环境中会被运行多次,%do%串行执行,%dopar%并行执行。执行ex的结果默认作为list类型返回,我们通过.combine参数指定返回结果类型。c用于连接执行结果为向量类型,‘cbind’ 和 ‘rbind’ 合并向量为矩阵类型,‘+’ 和 ‘*’ 用于处理数值类型。并行执行在执行并行计算之前,需要声明集群,即告诉R我们有多个核(cpu)。具体步骤如下:其中type可以为,前者创建新的se原创 2022-06-09 21:34:38 · 1446 阅读 · 0 评论 -
层次聚类示例实战教程
聚类是一种机器学习算法,它试图把数据集的观测值分为不同的簇。即相似观测值聚为簇,反之不相似的在不同簇中。聚类属于无监督,它尝试从数据集中发现结构,而不是预测响应变量的值。聚类通常用于市场分析,例如某公司有下列信息:家庭收入家庭人数户主职业距市区距离如果这些是有效信息,聚类可以识别类似家庭可能会购买一定产品或对某类广告响应较好。聚类最常用算法是KMeans,但需要预先设定聚类数量。对应的层次聚类算法不需要预先设定聚类数量,它能够生成树形结构——称为系统树图。介绍层次聚类与KMeans类似原创 2022-05-26 21:22:02 · 3154 阅读 · 2 评论 -
通过示例快速理解二次回归
当两个变量有线性关系时,通常使用简单线性回归测定它们的关系。但变量间有二次关系时,应该使用二次回归进行拟合。本文介绍R如何实现二次回归。示例假设我们希望理解工作时长与幸福感之间的关系。现收集到下面数据集,包括每周工作时长以及调查反馈的幸福感(0~100):#create datadata <- data.frame(hours=c(6, 9, 12, 14, 30, 35, 40, 47, 51, 55, 60), happiness=c(14, 28,原创 2022-05-26 21:01:50 · 5622 阅读 · 0 评论 -
指数回归实战教程
指数回归是一种回归模型,主要用于下列场景:指数增长:开始增长缓慢,然后无限制快速加速;指数衰减:开始快速衰减,然后衰减缓慢直至趋近0.指数回归模型的方程形式如下:y=abx{y = ab^x}y=abxy : 响应变量x : 预测变量a,b : 描述x和y关系的回归系数下面通过R示例展示其实现过程。指数回归R示例准备数据首先创建有x,y组成的模拟数据:x=1:20y=c(1, 3, 5, 7, 9, 12, 15, 19, 23, 28, 33, 38, 44, 50, 5原创 2022-05-22 21:36:59 · 5925 阅读 · 0 评论 -
如何获取主成分实战教程
主成分分析(Principal components analysis,简称PCA)是无监督机器学习算法,用于发现主成分,即原始预测变量的组合形式,用于数据集中大部分变化。PCA分析的目标是用比原数据集更少的变量解释数据集中的大多数可变性。假设数据集包括p个变量,每次取其中两个变量利用散点图检查相关性,要是变量较多,则散点图数量会变得非常大。p个变量则包括p*(p-1)个散点图,如果p=15,则需要105个散点图。幸运的是,PCA提供了尽可能利用低维变量表示多维数据集的方式。如果能够在二维空间中获得大部原创 2022-05-18 20:07:49 · 1485 阅读 · 0 评论 -
主成分回归分析实战教程
本文介绍主成分回归分析(Principal Components Regression),并通过示例展示其实现过程。给定p个预测变量和响应变量,多元线性回归使用如最小二乘法获得最小误差平方和(RSS):RSS = Σ(yi–y^i)2{Σ(y_i – ŷ_i)^2}Σ(yi–y^i)2-Σ: 求和符号-yi{y_i}yi: 第i个观测的实际响应值-y^i{ŷ_i}y^i: 基于多重线性回归模型获得预测值然而,当预测变量高度相关时,会产生多重共线问题,导致模型系数估计不可靠、高方差.原创 2022-05-14 22:01:58 · 6783 阅读 · 0 评论 -
最佳回归模型选择指标——马洛斯CP值
本文介绍最佳回归模型选择指标——马洛斯CP指标,并通过示例说明选择过程及如何计算。马洛斯CP(Mallows’Cp) 指标用于在多个不同模型中选择最佳回归模型。其计算公式为:Cp = RSSp/S2–N+2(P+1){RSS_p/S^2 – N + 2(P+1)}RSSp/S2–N+2(P+1)参数说明:RSSp{RSS_p}RSSp : 有P个预测变量模型的残差平方和S2{S^2}S2 : 模型的均方差(通过MSE计算)N :样本大小P :预测变.原创 2022-05-14 12:05:11 · 4742 阅读 · 0 评论 -
卡方检验与方差分析的区别
卡方检验和方差分析(ANOVA:Analysis of Variance)是两种常用的统计检验,但了解两者差异并知道什么场景如何使用那种检验很重要。本文介绍两类检验的差异,并通过示例说明基于场景选择那种检验方法。卡方检验在统计学中,有两种不同类型的卡方检验:卡方拟合优度检验用于检验一个类别变量是否服从假设的分布。举例:想知道骰子是否均匀,我们抛投它50次,并记录它落在每个数字上的次数。想了解顾客每周天进店次数相等,随机选择一周,并记录没有进店人数。卡方独立性检验用于检验两个类.原创 2022-05-03 21:07:09 · 13423 阅读 · 0 评论 -
如何划分机器学习的训练集和测试集
使用机器学习算法时,通常需要把数据分为训练集和测试集,本文介绍R语言的三种实现方法,并通过示例进行学习。使用R内置方法依据sample函数生成指定概率的true和false的向量,然后利用该向量过滤数据集得到训练集和测试集,语法如下:# 设置随机种子,使得示例可以重复set.seed(1)# df是要分割的数据集# 使用 70% 数据集作为训练集,30% 作为测试集sample <- sample(c(TRUE, FALSE), nrow(df), replace=TRUE, pr.原创 2022-05-03 11:32:16 · 9387 阅读 · 3 评论 -
R实现方差分析教程
本文介绍F检验,并通过给出集中不同应用场景。F检验介绍F检验用于测试两个总体方差是否相等。原假设和备择假设如下:H0{H_0}H0: σ12{σ_1^2}σ12 = σ22{σ_2^2}σ22 (总体方差相等)H1{H_1}H1: σ12{σ_1^2}σ12 ≠ σ22{σ_2^2}σ22 (总体方差不相等)如果P值小于显著性水平(可以选择.01, .05, .10),那么你有足够证据拒绝原假设。通常我们在回归模型中可以看到F检验统计量,下面就从回归模型示例开始。整体显著性F检验.原创 2022-04-26 11:15:52 · 3530 阅读 · 0 评论 -
R语言假设检验完整入门教程
本文介绍假设检验的概念,以及如何实现T检验。包括单样本T检验、双样本T检验以及配对样本T检验。假设检验假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。R语言提供t.test()函数执行不同类型T检验,语法如下:# y为null 为单样本T检验t.test(x, y = NULL,alternative = c(“two.sided”, “less”, “greater”),mu = .原创 2022-04-20 22:44:55 · 7347 阅读 · 0 评论 -
如何衡量调查问卷一致性
本文学习克隆巴赫系数(Cronbach’s alpha)衡量调查问卷一致性,并通过示例展示计算过程。克隆巴赫系数(Cronbach’s alpha)是一种衡量问卷或调查内部一致性的方法,范围在0~1之间,值越高表明问卷或调查越可靠。最简单的计算方法是使用ltm包中的cronbach.alpha()函数。示例假设饭店管理者希望衡量顾客的整体满意度,发放调查问卷给10位顾客,他们能够用三个等级评价饭店。下面代码计算反馈调查的克隆巴赫系数:library(ltm)# 示例调查数据data &.原创 2022-04-19 21:21:38 · 4807 阅读 · 0 评论 -
R语言实现双变量分析教程
双变量分析表示分析两个变量。双变量分析是为了分析两个变量之间的关系,与单变量、多变量分析对应。主要有三种方式进行双变量分析。散点图相关系数简单线性回归下面使用测试数据作为示例来演示三种方法,供包括两个变量,HourStudied表示学习时间,ExamScore为测试成绩。exData <- read.csv("csv/exData.csv")exData# HourStudied ExamScore# 1 1 75# 2 .原创 2022-04-18 17:08:19 · 8512 阅读 · 0 评论 -
R语言实现单变量分析教程
单变量分析是理解单个变量的数值分布情况,与之相对的有双变量分析和多变量分析。加载示例数据因为csv文件中年收入字段有千分位分隔符,所以先定义转换函数。setClass("num.with.commas")setAs("character", "num.with.commas", function(from) as.numeric(gsub(",", "", from) ) )data <- read.csv("csv/data.csv",colClasses=c('n.原创 2022-04-17 23:21:21 · 2821 阅读 · 0 评论 -
标准化与归一化的差异
本文介绍统计学中标准化与归一化方法,包括计算公式和应用场景,以及两者的差异。两者计算公式标准化(Standardization) 和 归一化(normalization) 是数据缩放的两种方法.标准化缩放数据集为均值为0,标准化差为1,使用下面的公式:xnew_{new}new = (xi_{i}i – μ) / σxi_{i}i 是数据集中第i个值μ 为样本均值σ 样本标准差归一化缩放数据集,让每个元素落在0~1之间,使用下面公式:xnew_{new}new = (xi_.原创 2022-04-17 15:45:35 · 2273 阅读 · 0 评论 -
累积分布函数与概率密度函数的区别
本文简要介绍统计学中PDF (probability density function) 和 CDF (cumulative distribution function) 之间的差异。随机变量再讨论PDF 和 CDF之前,我们首先需要理解随机变量。随机变量通常用x表示,表示一些随机过程中产生的数值类型结果,分为两类:离散和连续。离散随机变量离散随机变量(discrete random variable) 仅能够表示可数的离散值,如1,2,100,1000等。离散随机变量的示例包括:抛20.原创 2022-04-15 11:47:57 · 21301 阅读 · 1 评论 -
R 计算数据框多个变量频次表
本文介绍利用R apply函数创建数据框中多个变量的频次表。apply() 函数首先我们看下apply()函数语法:apply(X, MARGIN FUN)参数解释:X: 数组、矩阵或数据框MARGIN: 对行或列应用函数,1 表示行, 2 表示按列FUN: 对行或列应用的函数下面通过几个示例进行说明。示例1:所有变量的频次计算下面示例计算数据框中所有变量的频次:df <- data.frame(var1=c(1, 1, 2, 2, 2, 2, 3), .原创 2022-02-26 11:02:16 · 1718 阅读 · 2 评论 -
R 计算时间序列的交叉相关性教程
本文介绍两个时间序列的交叉相关性,并通过示例说明R的计算过程。时间序列交叉相关性交叉相关性是衡量一个时间序列与另一个时间序列的延迟版本的相似程度。这种类型相关性可以用于预测另一个时间序列的未来值,也就是说,当前时间序列是另一个时间序列的先行指标。这种类型相关性常用在很多领域,包括:经济领域consumer confidence index (CCI) 消费者信心指数一般认为是gross domestic product (GDP) 的先行指标。举例:如果CCI在给定月份较高,则GDP在x月.原创 2022-01-22 21:50:52 · 5814 阅读 · 2 评论 -
R 实现滚动相关性教程
本文介绍滚动相关性,并给出R实现示例。滚动相关性是滚动窗口上两个时间序列的相关性。通过滚动相关性可以看到两个时间序列随时间的相关性。下面通过示例说明。假设我们有下面数据框,包括15个月内两种不同产品的销售量。#create datadata <- data.frame(month=1:15, x=c(13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24, 23, 22, 20), .原创 2022-01-19 17:15:13 · 2651 阅读 · 1 评论 -
R计算二列相关性
本文介绍二列相关性概念并通过示例说明其计算过程。二列相关性用于衡量二值变量x与连续变量y之间的关系。类型皮尔逊相关系统,二列相关性系数取值范围也在[-1,1]之间。-1 表示两个变量完全负相关0 表示两个变量没有相关性1 表示两个变量完全正相关下面通过示例来说明如何计算二列相关性。假设有下面二值变量x,连续变量y:x <- c(0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0)y <- c(12, 14, 17, 17, 11, 22, 23, 11, 19.原创 2022-01-14 19:52:41 · 3827 阅读 · 2 评论 -
R计算偏相关性示例教程
本文介绍偏相关的概念,并用R解释其计算过程。统计学通常实用皮尔逊相关系数衡量两个变量之间的先行关系。但有时我们需要保持第三个变量不变时,计算两个变量之间的关系。举例,假设保持学生当前学习成绩不变的情况下,计算学生学习的时间与期末考试之间的关系。这是我们使用偏相关衡量学习时间与期末考试成绩之间的关系。下面通过示例来解释计算过程。下面数据框包括10个学生的当前成绩、学习时间以及期末考试分数:df <- data.frame(currentGrade = c(82, 88, 75, 74, .原创 2022-01-13 20:10:37 · 4922 阅读 · 4 评论 -
R do.call & call 函数教程
本文我们学习如何使用 R中的do.call & call 函数语法说明首先我们看看两个函数的语法:do.call 函数执行一个函数,参数包括被执行函数的名称以及list参数指定被执行函数的参数。do.call("any_function", arguments_list) # Basic R syntax of do.call functioncall 函数创建一个可以执行的函数对象,用于后续执行。call("any_function", argument1, argument2) .原创 2022-01-09 19:47:29 · 2792 阅读 · 0 评论 -
皮尔逊相关性的五个假设前提
皮尔逊相关性的五个假设前提本文介绍皮尔逊相关性的五个假设前提,并对每个假设前提进行详细说明。皮尔逊相关系数(也称为"积矩相关系数")是衡量两个变量之间的线性关联。它的取值范围在[-1,1]之间:-1 表示完全负相关0 表示完全不相关1 表示完全正相关但我们在计算皮尔逊相关性时,要了解它要符合5个假设:变量类型:两个变量要属于区间或比例变量线性关系:两个变量之间存在一定线性关系正太分布:两个变量应该大致符合正太分布数据配对:数据集中每个观测数据包括成对数据原创 2022-01-06 19:51:40 · 13424 阅读 · 0 评论 -
R 计算变量之间的相关性
本文介绍相关性,以及如何在R中计算多个变量之间的相关性。相关性相关性是统计学中术语,它使用协方差法来衡量向量之间的相关性程度。数学上公式为:x 表示数据向量xy 表示数据向量yx 拔 表示x的均值y 拔 表示y的均值R 中使用cor函数计算相关性。语法如下:cor(x, y, method)x 和 y 表示数据向量,method 指定计算相关性的方法,默认为 pearson。皮尔逊相关系数是量化两个变量之间的相关性,即两个变量的线性关系,其值在-1到1之间:-1 表示两个.原创 2022-01-03 11:17:59 · 10175 阅读 · 0 评论 -
介绍 R 工作区数据镜像文件
介绍保存载入 R 工作区数据镜像文件本文介绍R的工作区数据镜像文件,用于保存数据变量,方便下次加载使用。2021年最后一篇,象征意义大于实际,系统优于目标。RDA文件介绍工作区数据镜像文件是保存在工作目录下扩展名为 .RData或 .rds 、.rda的文件,可以用于工作区再次加载使用。它以R原生格式存储R对象,相比其他文件格式的优势为:存储数据更快保留了R特定的数据信息编码(如,属性、变量类型等)。saveRDS/readRDS 函数saveRDS/readRDS 函数处理单个R对象原创 2021-12-31 21:29:09 · 1504 阅读 · 0 评论 -
R 填充数据集中的缺失值
R 填充数据集中的缺失值本文介绍用简单方法快速替换缺失值。实际应用中要根据实际情况选择合适的方式填充缺失值。填充数据框缺失值通常我们会用特定列的均值或中位数填充数据框列的缺失值。对应的代码大概如下:df$col[is.na(df$col)] <- mean(df$col, na.rm=TRUE)如果所有列都是数值类型,可以使用下面代码模板:for(i in 1:ncol(df)) { df[ , i][is.na(df[ , i])] <- mean(df[ , i], n原创 2021-12-25 19:57:32 · 7237 阅读 · 0 评论 -
R pacman 最快捷安装加载插件包
本文介绍pacman包,用于快速管理R插件包,安装、加载、卸载包。pac包介绍pac包提供了便捷的工具管理R第三方插件包。提供功能覆盖了R内置的基本的函数,如library(),install.packages的功能,并把这些函数的功能合并值新的函数中,让用户更加快捷、方便管理插件包。本文通过几个示例让你快速掌握pcaman.** 安装pac包要使用pacman提供的功能合并函数,需要先安装并载入pacman:install.packages("pacman")library(pacman.原创 2021-12-25 09:10:10 · 1177 阅读 · 0 评论 -
R 矩阵相关计算函数汇总
本文我们介绍使用R语言实现矩阵的常见运算。包括矩阵加减以及乘法运算、矩阵转置、逆矩阵、行列式、特征值和特征向量等计算。矩阵的加减加减是矩阵的最基本操作,下面定义示例矩阵,为后面所有示例使用。# 示例方阵A <- matrix(c(10, 8, 5, 12), ncol = 2, byrow = TRUE)A# [,1] [,2]# [1,] 10 8# [2,] 5 12B <- matrix(c(5, 3, .原创 2021-12-24 11:14:15 · 9084 阅读 · 0 评论 -
R 计算向量点积
向量点积给定向量a,b:a = [a1, a2, a3]b = [b1, b2, b3]向量点积记为 a · b,对应的计算公示为:a · b = a1 * b1 + a2 * b2 + a3 * b3我们看到向量点积的结果为标量,表向量a在向量b上投影的距离。举例说明:a = [2, 5, 6]b = [4, 3, 2]a · b = 24 + 53 + 6*2a · b = 8 + 15 + 12a · b = 35本质上点积就是两个向量中相应元素的乘积的和。R计算点积原创 2021-12-22 21:35:16 · 2961 阅读 · 0 评论 -
R语言中缀操作符教程
本文我们介绍R中缀操作符,包括如何使用以及自定义中缀操作符。R大多数操作符属于二元操作符,因此属于中缀操作符,操作符在两个操作数之间。实际上底层是函数调用。举例,a+b 表达式调用+()函数,其参数为a,b , 即 +(a,b)。注意+上的重音符号表示函数名称包含特殊符号。R 中缀符号对应函数下面代码展示常规操作,分别使用中缀操作符以及对应函数方式。5+3# [1] 8`+`(5,3)# [1] 85-3# [1] 2`-`(5,3)# [1] 25*3-1# [1] 1.原创 2021-12-22 19:17:38 · 638 阅读 · 0 评论 -
R 汇总日期序列数据
本文介绍如何处理日期序列数据,并对每天的数据按照月、年进行汇聚。日期处理汇聚日期序列数据,即按照一定的日期间隔进行分组汇总。因此需要从日期字段中抽取年、月、日、季度等信息。通常方法通过format函数实现。#define datedate <- as.Date("2021-01-25")#format dateformatted_date <- format(date, format="%m/%d/%y")需要抽取日期期间,通过format参数指定。具体内容读者可以查看帮助.原创 2021-12-20 20:43:07 · 1658 阅读 · 2 评论 -
R 计算平均值标准误差
平均值的标准误差用于衡量数据的分散程度,本文介绍两种方法计算平均值的标准误差。平均值标准误差定义平均值标准误差 = s / √ns: 样本标准差n: 样本数量std.error()plotrix 包提供了该方法,使用之前需要按照加载包:library(plotrix)# 示例数据集data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)# 计算平均值的标准误差.原创 2021-12-19 20:49:38 · 12318 阅读 · 0 评论 -
ggplot2画组合图
我们通常会希望使用ggplot2创建横向、纵向并列图,方便同时对比查看数据的不同方面特性。我们可以使用patchwork包很容易实现。加载包#install ggplot2 and patchwork packagesinstall.packages('ggplot2')install.packages('patchwork')#load the packages library(ggplot2)library(patchwork)本文我们展示几个示例教你使用这些包创建多个并列图。.原创 2021-12-18 17:04:05 · 4211 阅读 · 0 评论 -
R 实现层次分析法确定指标权重
层次分析法(Analyt Hierarchy Process,缩写AHP)是将决策有关的元素分解成目标、准指、方案等层次,在次基础上进行定性和定量分析的决策方法。本文通过一个示例描述R的实现过程。概述层次分析法计算指标权重的基本思路是,首先建立有效的递阶指标系统,然后主管地将指标两两对比构造判定矩阵,再根据判定矩阵进行数字处理及一致性检验,就可获得各个指标的相对重要性权数。例子:在地区间宏观经济效益评价中,选取资金利税率(x1)、投资效果系数(x2)和劳动生产率(x3)三项指标。某专家认为,资金.原创 2021-12-17 22:39:58 · 5879 阅读 · 2 评论 -
R 创建雷达图
雷达图,也称蜘蛛图,可以同时展示多个变量的数量对比情况。本文利用fmsb库创建雷达图。数据准备要创建雷达图,数据需要满足一些约定:需要展示在图上的每个变量需要有对应的数据列第一行必须包含最大值第二行必须包含最小值第三及之后的行包含需要在雷达图上展示的数据为了演示,下面代码的数据框包含每天光顾门店的客户数量信息。准备好数据之后,利用fmsb库的radarchart()函数创建雷达图:#create datadf <- data.frame(Mon=c(100, 0, 34, 2.原创 2021-12-13 22:12:21 · 1233 阅读 · 1 评论