R语言学习5——函数篇

一、数学统计函数

1.概率分布函数

2.生成随机数:

runif(n)生成n个0-1的数;想生成0-10间的数就用runif(n)*10

runif(n,min=  ,max=  )  有必要时用round()取整

设计随机数种子,这样就能生成相同的随机数了,保证在不同设备上也能独立获得相同的结果,重现随机分组

> set.seed(666)  //666是自己随便设的种子编码
> runif(10)
 [1] 0.77436849 0.19722419 0.97801384 0.20132735 0.36124443 0.74261194 0.97872844 0.49811371 0.01331584
[10] 0.25994613
> set.seed(666)
> runif(10)    //相当于set.seed(666)和它下面第一个runif(10)锁了
 [1] 0.77436849 0.19722419 0.97801384 0.20132735 0.36124443 0.74261194 0.97872844 0.49811371 0.01331584
[10] 0.25994613
> runif(10)    //这个runif就不一样了吧
 [1] 0.77589308 0.01637905 0.09574478 0.14216354 0.21112624 0.81125644 0.03654720 0.89163741 0.48323641
[10] 0.46666453

二、描述性统计函数(很多,这里只列几个)

1.summary:提供最大值、最小值、四分位数、数值型变量的均值、因子变量和逻辑向量的频数统计。

2.fivenum:最基本的五个特征值,最小值、下四分位数、中位数、上四分位数、最大值。

3.aggregate;describe;

4.doBy包:summaryBy(x+y+z~m(类别型分组变量),data=指定数据集,FUN=指定函数)

三、频数统计函数

有因子才能进行分组,分组之后才能进行频数统计

1.一维频数统计:

用as.factor( )转化为因子,然后用split函数进行分组;如果不是明显的因子,可以用cut函数进行分割;分组之后用table函数进行频数的统计;prop.table(table( ))用来统计频率。

2.二维频数统计:二维列联表

注:Arthritis是vcd中的一个数据集,Treatment和Improved是其中两列

table:

> table(Arthritis$Treatment,Arthritis$Improved)
         
          None Some Marked
  Placebo   29    7      7
  Treated   13    7     21
> with(data = Arthritis,(table(Treatment,Improved)))
         Improved
Treatment None 
  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值