R语言入门
文章平均质量分 81
止葸信息
技术改变人生,科技点亮生活
展开
-
基于R语言的统计分析基础:使用dplyr包进行数据操作
dplyr`是R语言中一个功能强大且流行的数据操作包,它提供了一系列用于数据清洗、转换、汇总和可视化的工具。这些工具包括选择列、过滤行、排序、添加或修改列、汇总数据以及分组和合并数据集的函数。`dplyr`的设计使得数据操作变得简单直观,同时保持高性能,并且支持与外部数据库的连接、懒惰数据操作以及窗口函数。此外,`dplyr`鼓励使用整洁数据的原则,并与其他R语言包(如`tidyr`、`ggplot2`等)有很好的集成,形成一个完整的数据分析工作流。原创 2024-09-16 15:17:36 · 883 阅读 · 0 评论 -
基于R语言的统计分析基础:使用SQL语句操作数据集
在使用R语言数据分析时,可以融合SQL语言使数据聚集操作更加便利,同时也可以增加对SQL语句的熟悉。借助`sqldf`、`DBI`、`RSDLite`等包,可以在R环境中直接运用SQL语句,轻松实现数据的分组统计、汇总分析,SQL的强大查询能力简化了数据处理步骤,让复杂分析变得简单。原创 2024-09-16 10:33:56 · 1482 阅读 · 0 评论 -
基于R语言的统计分析基础:使用键盘输入数据
在R语言中,键盘输入数据是一种灵活且直接的数据获取方式,适用于处理小数据集或需要即时用户交互的场景。通常用于交互式数据探索和分析、临时数据处理、交互式图形绘制、脚本自动化中的用户交互、特定应用场景下的数据录入中。原创 2024-09-15 16:02:14 · 582 阅读 · 0 评论 -
Windows系统安装R语言及RStudio、RTools
R语言是一种用于统计分析、绘图的语言和操作环境,它属于GNU系统的一个自由、免费、源代码开放的软件,最初是基于S语言(由AT&T贝尔实验室开发)的一种实现,由新西兰奥克兰大学的Robert Gentleman和Ross Ihaka及其他志愿人员开发,并由“R开发核心团队”负责维护。。R语言广泛的应用在数据科学、生物信息学、金融工程、计算机科学、商业分析、社会科学和医学统计,拥有庞大的第三方包库,涵盖了从基础统计分析到高度专业化领域的应用,极大地扩展了R的功能,同时R语言内置了多种统计和图形函数,能够轻松实原创 2024-09-12 10:39:10 · 1484 阅读 · 0 评论 -
基于R语言的统计分析基础:使用ggplot2包进行绘图
ggplot2是一个基于图形语法的R包,它允许用户通过声明式方式指定数据、美学映射和图形元素来灵活创建复杂且美观的可视化图表原创 2024-09-08 12:11:39 · 1931 阅读 · 0 评论 -
基于R语言的统计分析基础:操作XML文件与YAML文件
YAML和XML都是用于数据表示和交换的文本格式,但它们在语法、用途和特点上有所不同。YAML以其简洁性和易读性在配置文件和数据交换领域得到广泛应用,而XML则因其可扩展性和自描述性在需要复杂数据结构和跨平台数据交换的场景中占据重要地位。原创 2024-09-08 09:00:00 · 819 阅读 · 0 评论 -
使用Julia语言和R语言实现K-均值
K-均值聚类算法属于一种无监督学习的方法,通过迭代的方式将数据划分为K个不重叠的子集(簇),每个子集由其内部数据点的平均值来表示。这里使用Julia语言及R语言来实现K-均值算法。原创 2024-03-09 17:37:52 · 1647 阅读 · 0 评论 -
使用Julia及R语言生成正态分布的随机数字并写入CSV文件
在操作之前需要先下载Julia的Distributions包,这个包用于进行相关概率分布的函数调用。测试次数为3次一组,属于小样本量,所以使用 n-1 作为分母来得到无偏估计。这里我使用我们自己实验室的实测数据 ,平均值。=0.11,数据分布服从于正态分布,使用。完整版Julia代码。原创 2024-03-13 20:27:18 · 332 阅读 · 0 评论 -
使用R语言计算模拟二项分布
二项分布是一种离散概率分布,描述了在n次独立重复的伯努利试验中成功的次数的概率分布。其中,每次试验的结果只有两个可能:成功或失败,且每次试验的成功概率p是相同的。原创 2024-03-14 20:57:26 · 1133 阅读 · 0 评论 -
RStudio更换R语言版本
RStudio更换R语言版本原创 2024-03-11 14:50:25 · 4516 阅读 · 1 评论 -
使用R语言计算矩形分布(均匀分布)并绘制图形
矩形分布(均匀分布),是指在某一区间内,随机变量取任何值的概率都是相同的。这种分布的概率密度函数在一个特定的区间内是一个常数,因此其图形呈现出一个矩形的形状,故得名为“矩形分布”。在概率论和统计学中,这是一种非常重要的概率分布方式,具有广泛的应用。原创 2024-04-10 17:32:32 · 1133 阅读 · 0 评论 -
R语言计算:t分布及t检验
t分布也称Student’s t-distribution,主要出现在小样本统计推断中,特别是当样本量较小且总体标准差未知时,用于估计正态分布的均值。其定义基于正态分布和X2分布(卡方分布)。如果随机变量X服从标准正态分布N01,而Y服从自由度为n的卡方分布,且X与Y相互独立,那么变量TnY服从自由度(v)为n的t。原创 2024-04-12 13:47:32 · 2640 阅读 · 0 评论 -
R语言实现:统计学及计量专业中的多种平均值计算方式
平均值在计量专业和统计学中有着广泛的应用如:描述数据集中趋势、比较不同组数据、评估数据的代表性、决策和判断、回归分析概率统计与财务分析等。此外,在计量专业中,平均值还被广泛应用于各种测量和校准过程中,以确保测量结果的准确性和可靠性。例如,在实验室测量中,多次测量的平均值可以提高测量的精度;在质量控制中,通过计算产品的平均质量水平来评估生产过程的稳定性等。原创 2024-04-06 21:22:33 · 1345 阅读 · 2 评论 -
基于R语言的统计分析基础:数据结构
R语言是一种用于统计分析和图形表示的编程语言和软件环境,它提供了多种数据结构以存储和操作数据。这些数据结构包括向量、矩阵、数组、数据框、列表、因子、Tibble、环境、公式、调用以及表达式。原创 2024-08-25 20:50:23 · 1372 阅读 · 0 评论