![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R语言统计分析
文章平均质量分 64
使用R语言进行统计分析
maizeman126
这个作者很懒,什么都没留下…
展开
-
《R语言与农业数据统计分析及建模》学习——创建与访问数据框
数据框具有多种基本属性可以用于查看和处理数据,包括纬度、列名、数据类型、列数、行数、摘要信息等。用read.table()、read.csv()函数读入外部文件的表格数据,也将可以数据框的形式保存在R中。在R语言中,可以使用不同的索引方式对数据框中的数据进行访问、索引和切片。使用data.frame()函数,可以通过列名和数据向量创建数据框。每个列名后面紧跟着一个数据向量,每个数据向量表示数据框中的一列。多种特点使数据框在数据和分析复杂数据时非常有效和方便。1、数据框的概念和特点。2、数据框的基本操作。原创 2024-04-20 01:00:00 · 421 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——R基础包的函数
基础包是R语言的核心组成部分,构建了R语言的基本功能框架。是R语言默认的安装包,不需要额外安装,使用时无需加载。(2)数据模式和结构转换:as.numeric()、as.data.frame()、as.Date()(3)统计分析函数:mean()、median()、dnorm()、t.test()(1)数据处理函数:unique()、sort()、subset()(4)图形绘制函数:plot()、hist()、pie()2、常用函数及其功能。原创 2024-04-17 01:00:00 · 270 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——数据读入
以2中的绝对路径为例,若将"D:/R_class_new"设置为当前工作目录,则其后面的"./documents/data.csv"就是相对路径;若将"D:/R_class_new/documents"设置为当前工作目录,则"data.csv"就是相对路径。2、从文本文件中读取数据:用read.table()、read.csv()等函数从文本文件中读取数据。读取文件中的数据首先要确定文件路径,如果文件不在工作目录下,则必须使用绝对路径。1、使用R的函数edit()自动调用一个允许手动输入数据的数据编辑器。原创 2024-04-16 01:00:00 · 469 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——控制流
在R语言中,常见的循环语句有for、while和repeat。R语言中,条件语句有if、else if和else关键字组成。循环语句允许程序重复执行特定的代码块,知道满足特定条件。控制流是指根据循环或条件来控制程序的执行顺序和逻辑。1、控制流的概念和作用。原创 2024-04-19 01:00:00 · 201 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——操作数据框
R的基础包中使用rbind()函数新增行,使用[-行索引,]的方式从数据框中删除列,使用$的方式新增或删除列。要修改数据框中的数据,可以使用行列索引或列名索引的方式来定位要修改的数据,并赋予新的执行。使用split()函数根据数据框中选定列的不同取值将数据框拆分为多个子数据框。使用order()函数按照数据框中选定列的数据大小对数据框进行排序。R语言中,使用rbind()函数按行合并数据框。R语言中,使用cbind()函数按行合并数据框。2、数据框的合并和拆分。(1)按行合并数据框。(2)按列合并数据框。原创 2024-04-21 01:00:00 · 269 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——数据框的统计处理
常用的方法包括:使用subset()函数或逻辑运算符(例如==,>,<等)结合行列索引来查询数据。在数据处理过程中,有时需要对数据框的类型进行转换,比如将字符型转换为数值型,日期型转换为字符型等。重编码是指将数据框中的特定值映射为新的值,通常用于创建分类变量。aggregate()函数用于对数据框进行聚合操作,可以按照指定的条件对数据进行分组,并计算每组的汇总统计量。缺失值是指数据中缺少某些观测值或信息,而重复值是指数据中存在相同的观测记录。FUN:指定要进行聚合操作的函数,如sum,mean,max等。原创 2024-04-22 01:00:00 · 154 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——数据框的向量化操作
向量化操作是指对整个数据结构进行一次性操作,而不需要使用显式的循环结构(即同时处理整个数据框的元素,而不需要使用for循环逐个处理每个元素)。条件语句可以根据某些条件对数据框的值进行修改,如根据特定条件修改某列的值,或根据多个条件创建新的列。通过逻辑运算符,我们可以筛选出数据框中满足特定条件的行或列,这样可以快速提取感兴趣的数据子集。R语言中,数学函数是向量化的,可以对整个数据框中的列进行批量计算,例如求和、求平均、取对数等。apply()系列函数是R中强大的向量化函数,可以对数据框的行或列进行迭代操作。原创 2024-04-23 01:00:00 · 200 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——自编函数
arg1_value,arg2_value是实际参数的值,用于传递给函数。自编函数是用户根据自己需求编写的函数,用于执行特定任务或实现特定功能。return(result)用于返回函数的结果。function_name是自编函数的名称。arg1,arg2,...是函数的输入参数。函数体:是一系列的R语句和操作。(3)提高代码的可维护性。(1)提高代码的可读性。(2)提高代码的重用性。1、自编函数的概念和作用。2、自编函数的语法和结构。3、编写简单的自编函数。原创 2024-04-18 01:00:00 · 201 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——并行计算
例如:有10万个结构相同的数据文件,想把每个文件的数据都读出来。案例:写一个function,实现对一个数取平方之后,再除以17,再乘以19。针对1至100000的自然熟,运行这个function。案例2:正对1到2000000每个自然数除以13,如果余数大于5,则求该数平方,否则求开平发。当下时代,我们需要处理的数据量日渐增大,R的计算模式限制了R处理大规模数据的能力。R语言是一个单线程的程序。并行计算是指同时使用多种计算资源解决计算问题的过程。案例1:计算1到1000每个自然数的平方。原创 2024-05-04 01:00:00 · 234 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——ggplot2绘图基础
散点图:用于展示两个变量之间的关系,可用于观察数据的分布、趋势和异常值。折线图:用于展示随时间或其他连续变量变化的趋势,常用于时间序列数据或连续试验结果。饼图:用于显示不同部分占整体的比例,适用于展示百分比或比例数据。柱形图:用于比较不同类别之间的数据,适用于展示离散数据或对比不同处理组的结果。直方图:用于展示数据的分布情况,特别适用于连续数据的分布查看。箱线图:用于展示数据的分布情况和异常值,可同时显示多个组别的数据比较。热力图:用于可视化矩阵型数据,通过颜色映射展示变量之间的关系。原创 2024-04-24 01:00:00 · 853 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——数字图像处理
EBImage包中提供了translate、resize、rotate等函数来实现图像的平移、尺寸缩放、旋转、平移等操作。R语言中使用EBImage图像处理包:能够在R语言环境下进行信号处理、统计建模、机器学习和图像数据可视化。图像是以矩阵或者数组的形式存储的,对其进行加减乘除数学运算,可以实现图像亮度的增强与减弱。图像的乘方操作会使数值小的像素点变得更小最后趋于0,而本身为1的白像素点保持不变。通过两张图像的加减可以实现图像的合并与差分。,实现图像反色处理,在有些时候可以有效的提取图像的信息。原创 2024-05-03 01:00:00 · 445 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——判别分析和主成分分析
判别分析又称“分辨法”。使用已知分类的数据训练建立分类规则,然后把这样的规则应用到未知分类的样本中去分类,以识别位置样本所属的分类。判别分析多用于遥感影像的地物分类;农林害虫预报;气象数据中的天气预报等等。原创 2024-04-28 01:00:00 · 952 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——回归分析
在系数的t检验,可知rain变量的回归系数是显著的,而temp变量的回归系数是不显著的。spreadLevelPlot()函数创建一个添加了最佳拟合曲线的散点图,来展示标准化残差绝对值与拟合值的关系。线性回归是一种广泛用于数据分析、预测和建模的技术,可以帮助我们理解变量之间的关系,并进行预测和推断。简单线性回归是线性回归的一种特殊情况,适用于只有一个自变量和一个因变量的情况。(2)Durbin-Watson检验的函数,能够检测误差的序列相关性。最常见的方法就是对lm()函数的返回对象使用plot()。原创 2024-04-29 01:00:00 · 584 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——机器学习
机器学习方法是计算机利用已有的数据(经验),得出某种模型,并利用此模型预测未来的一种方法。比较模型的预测精度,需要进行多次训练模型并预测,得到较稳定的结果。(2)直接比较平均预测精度虽然可以看出模型的平均水平,但难以得到模型的上下限以及稳定性等信息。不同的机器学习模型需要使用不同的函数包,因此我们自爱建模之前要先下载安装好相应的函数包。决策树方法,处理离散值时,称为决策树;注意:运行30次仍具有一定的偶然性,每次运行的结果仍会有所不同。(1)模型的比较可以直接使用平均预测精度直接进行比较。原创 2024-05-02 01:00:00 · 332 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——方差分析
方差分析是研究一种或多种因素的变化对试验结果的观测值是否有显著影响,从而找到较优试验条件或生产条件的一种常用数理统计方法。方差分析根据平方和的加和原理,利用F检验,进而判断试验因素对试验结果的影响是否显著。原创 2024-04-26 01:00:00 · 1260 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——聚类分析
聚类分析时一种分类技术。与回归分析、判别分析被一起成为多元分析的三大方法。根据分类的方法可将聚类分析分为:层次聚类、快速聚类等。原创 2024-04-27 01:00:00 · 481 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——logistic回归和poisson回归
普通线性回归通常用来描述变量y与x之间的线性关系:普通线性模型的假设是:响应变量y是连续型变量而且,服从正态分布分布。但在很多现实情况y并不是正态分布,如:二值问题/多分类问题,计次问题等,这些问题都是广义线性回归的范畴。广义线性回归用于解决因变量不是正态分布的问题。原创 2024-05-01 01:00:00 · 431 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》——多重共线性和逐步回归
而且结合前面自变量与因变量的关系图可知3个自变量与因变量是正相关关系,但temp的回归系数却是负的。VIF>5表明存在严重的共线性。逐步回归用于筛选最重要的变量,来建立回归分析的预测或者解释模型。可以解决:当因变量受到大量因素的影响时,建立回归模型,将不可能也没必要考虑的所有影响因素排除在外。作物产量与生育期内气象条件密切相关,现有某地区10年的作物产量和太阳辐射、温度、降雨的统计数据,据此建立回归模型。逐步回归分析是一种AIC信息统计量为准则,通过选择最小的AIC信息统计量,来达到删除或增加变量的目的。原创 2024-04-30 01:00:00 · 782 阅读 · 0 评论 -
《R语言与农业数据统计分析及建模》学习——描述性统计分析
描述性统计是对数据进行概括和描述,便于理解数据的特征、趋势和分布,帮助我们了解数据基本情况和总体特征,为后续更深入的数据分析和建模提供基础。Hmisc包中的describe()函数可返回变量可观测的数量、缺失值和唯一值的数目、平均值、分位数、以及前五个最大值和最小值。它可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误。基础包中的summary()函数提供最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑性向量的频数统计。原创 2024-04-25 01:00:00 · 393 阅读 · 0 评论