![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R语言数据分析
文章平均质量分 69
hence..
这个作者很懒,什么都没留下…
展开
-
R语言使用flextable包将输出结果导入word,并设置默认输出三位小数
Error: package or namespace load failed for 'flextable' in loadNamespace(j = 0.39 is requiredTraceback:`原创 2023-06-03 14:02:54 · 1460 阅读 · 0 评论 -
解决ggplot绘制散点图形状超过6个的警告
警告消息: “形状调色板最多可以处理6个离散值,因为超过6个将很难区分;如果必须使用形状,可以考虑手动指定。”警告消息: “删除了包含丢失值(‘ geom _ point ()’)的62行。原创 2022-11-18 23:40:10 · 2071 阅读 · 0 评论 -
R语言绘制群峰图
本文以iris数据为例,制作群峰图。原创 2022-08-22 14:25:16 · 308 阅读 · 0 评论 -
Markdown编辑器语法说明
你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:撤销:Ctrl/Command + Z重做:Ctrl/Command + Y加粗:Ctrl/Command + B斜体:Ctrl/Command + I标题:Ctrl/Command + S原创 2022-08-19 16:32:04 · 114 阅读 · 0 评论 -
多元数据的相关性检验——基于R
对于多元数据,讨论变量间是否具有相关关系是很重要的,这里介绍三种相关检验——,第一个检验是针对正态分布数据而言的,而后面两种检验属于秩检验。原创 2022-08-13 20:15:29 · 2548 阅读 · 0 评论 -
机器学习之文本挖掘—基于R语言
首先建立一个对象,计算每列综合,然后按照降序重新排列。默认的排序方式是升序,所以在freq前面加一个负号就变成了降序。我们使用的基础软件包是tm,这是专门的文本挖掘软件包。还需要SnowballC包进行词干提取,使用RColorBrewer包进行上色,当然还有wordcloud包。不难发现这些主题都是关于经济和商业的,可以由job,energy,reform和dificit这些词看出。LDA是一个生成式过程,他按照下面的步骤进行迭代,直到达到一个平稳状态。现在,使用tm包中的tm_map函数进行文本转换。.原创 2022-08-11 12:41:25 · 1207 阅读 · 3 评论 -
线性模型中的高级特征选择技术——基于R
岭回归(英文名:ridge regression, Tikhonov regularization)是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。岭回归的命令格式为glment(x=矩阵,y=响应变量,famliy=分布函数,alpha=0)当alpha=0是表示使用岭回归,当alpha=1时表示使用LASSO回归。,这个数量是不变的。..原创 2022-08-09 12:38:24 · 1879 阅读 · 0 评论 -
sample函数—R语言
比如我想从1到1000间中随机抽取50个整数,有放回的抽样(可重复抽样)如果你真的想从大于9的数中抽取的话,需要使用sample.int函数。1e3代表1000,1en代表10的n次方。大于10的样本(很明显一个没有)这也是需要注意的一点。这样输出结果就正常了。...原创 2022-08-07 18:42:26 · 23466 阅读 · 4 评论 -
logistic回归模型—基于R
logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。...原创 2022-08-07 15:48:10 · 5613 阅读 · 1 评论 -
机器学习中的线性回归——基于R
可以在这里下载数据,下载数据后用Rstudio打开就能使用,不需要加载其他东西。原创 2022-08-06 20:47:17 · 585 阅读 · 0 评论 -
图论与网络模型——基于R
从直观上看,所谓图就是由点与边组成的图形,如下图所示:在igraph中可用graph函数构件图,其使用格式为:其中:如图所示,把左边的这个图变成右边:参数graph为作图的对象,mode为字符串。取“mutual”(默认值)表示为木条边增加两个方向,取“arbitrary”表示为每条边任意添加一个方向graph.empty函数结果如下:用到graph.fromula函数graph.full()函数graph.ring()函数...原创 2022-08-06 14:30:49 · 847 阅读 · 0 评论 -
相关系数矩阵可视化
以下数据均为r语言数据自带的数据。原创 2022-07-19 17:27:01 · 1021 阅读 · 0 评论 -
R语言一页多图
本文主要讲述在基础绘图命令里面怎么一页多图,原创 2022-07-19 17:19:15 · 2302 阅读 · 0 评论 -
R语言绘制gif动图
代码】R语言绘制gif动图。原创 2022-07-18 14:25:49 · 1012 阅读 · 2 评论 -
R语言使用循环语句一次性画出多幅图
以数据iris为例,分别以Sepal.Length Sepal.Width Petal.Length Petal.Width 为纵坐标绘制小提琴图小提琴图的相关文章用循环语句画图:首先提取列名::这里用的是aes_string而不是aes,Species一定要加双引号,而我们的纵坐标提取出来的时候就有双引号,这个就不要加了...原创 2022-07-14 13:53:07 · 3357 阅读 · 0 评论 -
R常用创建函数与管道操作
R语言常用创建函数原创 2022-06-04 19:05:20 · 672 阅读 · 0 评论 -
R语言dplyr包
R语言dplyr包原创 2022-06-04 13:02:01 · 2841 阅读 · 0 评论 -
R语言基础函数assign函数
通过assign函数给变量赋值给保存在字符串中的变量名原创 2022-07-14 13:19:56 · 3379 阅读 · 0 评论 -
R语言灰色关联分析法
输入数据并用DT包的datatable函数展示数据ABDDEF分别对应第1到第6个供应商产品质量、技术水平、供应能力、经济效益、交货情况、市场影响度指标属于效益型指产品价格、地理位置、售后服务指标属于成本型指标。现分别对上述指标进行规范化:对于效益型指标(正项指标)标准化公式为:x∗=x−min(x)max(x)−min(x)x^{\ast}=\frac{x-min\left( x \right)}{max\left( x \right) -min\left( x \right)}x∗=max原创 2022-07-11 14:01:16 · 6502 阅读 · 2 评论 -
R语言伴随矩阵的计算
由于我没有找到计算伴随矩阵的相关函数,这里只能自己计算根据公式:AA∗=A∗A=∣A∣EAA^{\ast}=A^{\ast}A=\left| A \right|EAA∗=A∗A=∣A∣EAA∗∣A∣=E,根据逆矩阵的定义:即A∗∣A∣=(A)−1,即A∗=∣A∣(A)−1A\frac{A^{\ast}}{\left| A \right|}=E,\text{根据逆矩阵的定义:即}\frac{A^{\ast}}{\left| A \right|}=\left( A \right) ^{-1},\tex原创 2022-07-10 20:05:09 · 605 阅读 · 0 评论 -
R语言计算灰色Verhulst预测模型
如果上面有看不懂的可以看我的上一篇文章:GM(1,1)模型这里需要计算(BTB)−1BTY\left( B^TB \right) ^{-1}B^TY(BTB)−1BTY,R语言矩阵的相关计算可以看我的这篇文章crossprod(B,B)计算BTBB^TBBTB, solve(crossprod(B,B))计算(BTB)−1\left( B^TB \right) ^{-1}(BTB)−1,%*%表示两个矩阵的乘积,计算(BTB)−1BTY\left( B^TB \right) ^{-1}B^TY(BTB原创 2022-07-09 21:36:05 · 2065 阅读 · 0 评论 -
通过R语言做灰色预测
灰色预测的主要特点是模型使用的不是原始数据序列,而是生成的数据序列。其核心体系是灰色模型(Grey Model,GM),即对原始数据作累加生成(或其他方法生成)得到近似的指数规律再进行建模的方法。优点是不需要很多的数据,一般只需要4个数据,就能解决历史数据少、序列的完整性及可靠性低的问题;能利用微分方程来充分挖掘系统的本质,精度高;能将无规律的原始数据进行生成得到规律性较强的生成序列,运算简便,易于检验,不考虑分布规律,不考虑变化趋势。缺点是只适用于中短期的预测,只适合指数增长的预测。例题:,原创 2022-07-09 20:28:02 · 11974 阅读 · 30 评论 -
R语言矩阵的相关计算
例:求下列矩阵的转置b=[156242589]b=\left[ \begin{matrix} 1& 5& 6\\ 2& 4& 2\\ 5& 8& 9\\\end{matrix} \right] b=⎣⎡125548629⎦⎤这里我们用到函数输出结果:使用a%*%b表示矩阵ab的乘积,这里介绍第二种方法crossprod(X,Y)计算XTYX^TYXTY计算bTbb^TbbTb计算bbTbb^TbbT计算b∗bb*bb∗b用到eigen函数用到det函数原创 2022-07-08 21:04:27 · 5795 阅读 · 0 评论 -
在R的绘图中加入数学公式或者希腊字符
这里我先把xlab=“”,即x轴标题是空值,默认值是index防止设置时出现重叠情况首先生成一个数据框原创 2022-07-08 17:36:43 · 1435 阅读 · 0 评论 -
r语言计算行列式的值
计算下面的行列式∣2001002003004003∣ \left| \begin{matrix} 2& 0& 0& 1\\ 0& 0& 2& 0\\ 0& 3& 0& 0\\ 4& 0& 0& 3\\\end{matrix} \right|\,\,∣∣∣∣∣∣∣∣2004003002001003∣∣∣∣∣∣∣∣代码:输出结果是-12...原创 2022-07-07 16:23:50 · 2733 阅读 · 0 评论 -
R语言两个矩阵(两组)数据的相关性分析
Mantel tests是确定两组距离测度矩阵(而非两组变量矩阵)之间相关性的相关性测试方法,用于判断一个矩阵中的样本距离与另一矩阵中的样本距离是否相关。Mantel tests零假设为响应变量矩阵中对象之间的距离与解释变量矩阵不存在相关,如果结果中p值显著,则拒绝零假设,即存在相关性,随着一个矩阵中样本之间距离的增加(或减少),另一矩阵中对应样本之间的距离也增加(或减少)。数据是vegan包里自带的两个数据:我们使用vegdist函数计算距离矩阵,以下是参数其中method默认是布雷克蒂斯距离,可以原创 2022-07-05 19:25:57 · 11438 阅读 · 1 评论 -
R语言ggplot2中的一些细节问题
以示例数据cars为例示例数据BOD调整y轴范围从0开始,添加标记原创 2022-07-02 19:22:47 · 608 阅读 · 0 评论 -
R语言ggplot2绘制小提琴图,箱线图,抖动图
小提琴图这里我们可以调整一下箱线图的宽度使图形更加美观首先给小提琴图,箱线图,抖动图分别命名为a,b,c安装所需要的包添加横纵坐标标签首先把图形命名为为pdpi值越大,保存的图片越清晰参考链接...原创 2022-06-30 20:04:54 · 1393 阅读 · 0 评论 -
R语言apply函数族
现有数据如下,请求出每一行的最大值,和每一列的最小值每一行的最大值每一列的最小值lapply( )不仅适用于向量,也适用于列表。假设我们有一份学生列表:现在,我们想创建一个字符向量,其中每个元素都具有如下形式:James, 25 year-old man, loves reading, writing.函数 sprintf( )通过将占位符(例如:%s 对应字符串,%d 对应整数)替换为相应的输入参数来格式化文本。举个例子:输出结果:[1] “Hello, Tom! Your numbe原创 2022-06-30 16:00:44 · 1243 阅读 · 0 评论 -
R语言求导数和积分
例一:求sin(tanx)的导数\text{求}\sin \left( \tan x \right) \text{的导数}求sin(tanx)的导数求的结果为:cos(tanx)∗(1/cos2(x))=cos(tanx)sec2x\cos \left( \tan x \right) \ast \left( 1/\cos ^2\left( x \right) \right) =\frac{\cos \left( \tan x \right)}{\sec ^2x}cos(tanx)∗原创 2022-06-30 15:32:15 · 1472 阅读 · 0 评论 -
R语言缺失值的处理
如图所示,这个数据中有很多缺失值我们可以用函数来判断缺失值是TRUE则表明是,FALSE则表明不是缺失值我们可以用函数来计算缺失值的数量可以看出一共有43个缺失值如果数据是数据框的形式,使用此函数效果更佳当数据是数据框时,使用此函数可以直接删除缺失值,当数据是向量形式时,删除缺失数据的同时也会把缺失的数据给指出来可以看出缺失值变成了293.替换为标准差样本插值法...原创 2022-06-25 15:51:44 · 15712 阅读 · 2 评论 -
r语言读取网页数据
例如读取勒布朗.詹姆斯的10年生涯数据,会得到一个有26个变量的列表,该列表记录了他每年的平均得分、篮板和命中率等信息,这些都是以英文和数字记录的,所以读入后不会出现乱码。https://www.basketball-reference.com/players/j/jamesle01.html这是网页中的第三个表格,因此:which=3还有一列就不展示如果我想读取第一个表格,which=1(不写读取全部)...原创 2022-06-23 14:52:21 · 2858 阅读 · 0 评论 -
数据的标准化处理——基于R
将数据缩放到[0,1]的(min—max Normalization)X∗=Xi−XminXmax−XminX^{\ast}=\frac{X_i-X_{min}}{X_{max}-X_{min}}X∗=Xmax−XminXi−Xmin通常将上面这种标准化称为归一化缩放到[-1,1]的 Mean —NormalizationX∗=Xi−mean(X)Xmax−XminX^{\ast}=\frac{X_i-mean(X)}{X_{max}-X_{min}}X∗=Xmax−Xmin原创 2022-06-19 19:28:27 · 6348 阅读 · 0 评论 -
R语言的线性优化(一元、多元、约束条件)
R做一元函数优化求解得函数是optimize或者optimise以函数lnx−x2为例\text{以函数} \ln x-x^2\text{为例}以函数lnx−x2为例,现在分别在[1,4]上这个函数的最大值,最小值可以看出这个函数在我定义区间上的最大值和最小值,和此时x的取值如果你想用ggplot绘制函数,可以这样:多元函数优化求解得命令是optim,其基本用法是:求解函数f(x,y)=(x2+y−11)2+(x+y2−7)2的极值\text{求解函数}f\left( x,y \right原创 2022-06-10 13:53:55 · 2554 阅读 · 1 评论