数据整理练习,R

library(dplyr)
library(R6)
data(mtcars)
data(iris)
mydata<-mtcars
head(mydata)
mynewdata<-tbl_df(mydata)

myirisdata<-tbl_df(iris)


mynewdata

library(tidyr)

filter(myirisdata,Species %in% c("setosa","virginica"))

>filter(myirisdata,Species %in% c("setosa","virginica"))
# A tibble: 100 x 5
   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
          <dbl>       <dbl>        <dbl>       <dbl>  <fctr>
 1          5.1         3.5          1.4         0.2  setosa
 2          4.9         3.0          1.4         0.2  setosa
 3          4.7         3.2          1.3         0.2  setosa
 4          4.6         3.1          1.5         0.2  setosa
 5          5.0         3.6          1.4         0.2  setosa
 6          5.4         3.9          1.7         0.4  setosa
 7          4.6         3.4          1.4         0.3  setosa
 8          5.0         3.4          1.5         0.2  setosa
 9          4.4         2.9          1.4         0.2  setosa
10          4.9         3.1          1.5         0.1  setosa
# ... with 90 more rows
> > myirisdata
# A tibble: 150 x 5
   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
          <dbl>       <dbl>        <dbl>       <dbl>  <fctr>
 1          5.1         3.5          1.4         0.2  setosa
 2          4.9         3.0          1.4         0.2  setosa
 3          4.7         3.2          1.3         0.2  setosa
 4          4.6         3.1          1.5         0.2  setosa
 5          5.0         3.6          1.4         0.2  setosa
 6          5.4         3.9          1.7         0.4  setosa
 7          4.6         3.4          1.4         0.3  setosa
 8          5.0         3.4          1.5         0.2  setosa
 9          4.4         2.9          1.4         0.2  setosa
10          4.9         3.1          1.5         0.1  setosa
# ... with 140 more rows

> select(mynewdata,cyl,mpg,hp)
# A tibble: 32 x 3
     cyl   mpg    hp
 * <dbl> <dbl> <dbl>
 1     6    21   110
 2     6    21   110
 3     4    23    93
 4     6    21   110
 5     8    19   175
 6     6    18   105
 7     8    14   245
 8     4    24    62
 9     4    23    95
10     6    19   123
# ... with 22 more rows
> mynewdata
# A tibble: 32 x 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
 * <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
 1    21     6   160   110   3.9   2.6    16     0     1     4     4
 2    21     6   160   110   3.9   2.9    17     0     1     4     4
 3    23     4   108    93   3.8   2.3    19     1     1     4     1
 4    21     6   258   110   3.1   3.2    19     1     0     3     1
 5    19     8   360   175   3.1   3.4    17     0     0     3     2
 6    18     6   225   105   2.8   3.5    20     1     0     3     1
 7    14     8   360   245   3.2   3.6    16     0     0     3     4
 8    24     4   147    62   3.7   3.2    20     1     0     4     2
 9    23     4   141    95   3.9   3.1    23     1     0     4     2
10    19     6   168   123   3.9   3.4    18     1     0     4     4
# ... with 22 more rows
> > select(mynewdata,-cyl,-mpg)
# A tibble: 32 x 9
    disp    hp  drat    wt  qsec    vs    am  gear  carb
 * <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
 1   160   110   3.9   2.6    16     0     1     4     4
 2   160   110   3.9   2.9    17     0     1     4     4
 3   108    93   3.8   2.3    19     1     1     4     1
 4   258   110   3.1   3.2    19     1     0     3     1
 5   360   175   3.1   3.4    17     0     0     3     2
 6   225   105   2.8   3.5    20     1     0     3     1
 7   360   245   3.2   3.6    16     0     0     3     4
 8   147    62   3.7   3.2    20     1     0     4     2
 9   141    95   3.9   3.1    23     1     0     4     2
10   168   123   3.9   3.4    18     1     0     4     4
# ... with 22 more rows
> select(mynewdata,-c(hp,mpg))
# A tibble: 32 x 9
     cyl  disp  drat    wt  qsec    vs    am  gear  carb
 * <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
 1     6   160   3.9   2.6    16     0     1     4     4
 2     6   160   3.9   2.9    17     0     1     4     4
 3     4   108   3.8   2.3    19     1     1     4     1
 4     6   258   3.1   3.2    19     1     0     3     1
 5     8   360   3.1   3.4    17     0     0     3     2
 6     6   225   2.8   3.5    20     1     0     3     1
 7     8   360   3.2   3.6    16     0     0     3     4
 8     4   147   3.7   3.2    20     1     0     4     2
 9     4   141   3.9   3.1    23     1     0     4     2
10     6   168   3.9   3.4    18     1     0     4     4
# ... with 22 more rows


> mynewdata %>% select(cyl,wt,gear)%>% filter(wt >2)
# A tibble: 28 x 3
     cyl    wt  gear
   <dbl> <dbl> <dbl>
 1     6   2.6     4
 2     6   2.9     4
 3     4   2.3     4
 4     6   3.2     3
 5     8   3.4     3
 6     6   3.5     3
 7     8   3.6     3
 8     4   3.2     4
 9     4   3.1     4
10     6   3.4     4
# ... with 18 more rows

> mynewdata %>%
+ select(cyl,wt,gear)%>%
+ arrange(wt)
# A tibble: 32 x 3
     cyl    wt  gear
   <dbl> <dbl> <dbl>
 1     4   1.5     5
 2     4   1.6     4
 3     4   1.8     4
 4     4   1.9     4
 5     4   2.1     5
 6     4   2.2     4
 7     4   2.3     4
 8     4   2.5     3
 9     6   2.6     4
10     6   2.8     5
# ... with 22 more rows

> mynewdata %>%
+ select(mpg,cyl)%>%
+ mutate(newvariable=mpg*cyl)
# A tibble: 32 x 3
     mpg   cyl newvariable
   <dbl> <dbl>       <dbl>
 1    21     6         126
 2    21     6         126
 3    23     4          91
 4    21     6         128
 5    19     8         150
 6    18     6         109
 7    14     8         114
 8    24     4          98
 9    23     4          91
10    19     6         115
# ... with 22 more rows
> > mynewdata %>% rename(miles=mpg)
# A tibble: 32 x 11
   miles   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
 * <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
 1    21     6   160   110   3.9   2.6    16     0     1     4     4
 2    21     6   160   110   3.9   2.9    17     0     1     4     4
 3    23     4   108    93   3.8   2.3    19     1     1     4     1
 4    21     6   258   110   3.1   3.2    19     1     0     3     1
 5    19     8   360   175   3.1   3.4    17     0     0     3     2
 6    18     6   225   105   2.8   3.5    20     1     0     3     1
 7    14     8   360   245   3.2   3.6    16     0     0     3     4
 8    24     4   147    62   3.7   3.2    20     1     0     4     2
 9    23     4   141    95   3.9   3.1    23     1     0     4     2
10    19     6   168   123   3.9   3.4    18     1     0     4     4
# ... with 22 more rows



> mtcars[with(mtcars, order(cyl, disp)), ]
                    mpg cyl disp  hp drat  wt qsec vs am gear carb
Toyota Corolla       34   4   71  65  4.2 1.8   20  1  1    4    1
Honda Civic          30   4   76  52  4.9 1.6   19  1  1    4    2
Fiat 128             32   4   79  66  4.1 2.2   19  1  1    4    1
Fiat X1-9            27   4   79  66  4.1 1.9   19  1  1    4    1
Lotus Europa         30   4   95 113  3.8 1.5   17  1  1    5    2
Datsun 710           23   4  108  93  3.8 2.3   19  1  1    4    1
Toyota Corona        22   4  120  97  3.7 2.5   20  1  0    3    1
Porsche 914-2        26   4  120  91  4.4 2.1   17  0  1    5    2
Volvo 142E           21   4  121 109  4.1 2.8   19  1  1    4    2
Merc 230             23   4  141  95  3.9 3.1   23  1  0    4    2

> arrange(mynewdata, cyl, disp)
# A tibble: 32 x 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
 1    34     4    71    65   4.2   1.8    20     1     1     4     1
 2    30     4    76    52   4.9   1.6    19     1     1     4     2
 3    32     4    79    66   4.1   2.2    19     1     1     4     1
 4    27     4    79    66   4.1   1.9    19     1     1     4     1
 5    30     4    95   113   3.8   1.5    17     1     1     5     2
 6    23     4   108    93   3.8   2.3    19     1     1     4     1
 7    22     4   120    97   3.7   2.5    20     1     0     3     1
 8    26     4   120    91   4.4   2.1    17     0     1     5     2
 9    21     4   121   109   4.1   2.8    19     1     1     4     2
10    23     4   141    95   3.9   3.1    23     1     0     4     2
# ... with 22 more rows

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值