ggplot2技巧书《R数据可视化手册》读书笔记: 第一章 R基础

目录

 

1.1安装包

1.2加载包

1.3加载分隔符式的文本文件

1.4从Excel文件中加载数据

1.5从SPSS文件中加载数据


 

1.1安装包

install.packages(c("ggplot2","gcookbook"))

系统可能提示你选择一个下载镜像,选择离你最近的一个速度更快;选择Austria站点的版本是最佳新的,因为这是CRAN的主服务器。

CRAN是R包的仓库,是R默认使用的库。此外,还有几个软件包仓库,如Bioconductor,它是与及因素分析相关的包的软件包仓库。

1.2加载包

library(ggplot2)
library(gcookbook)

library加载一个软件包。一个package并不是一个软件库library,library指的是一个包含了若干个packages的目录。

1.3加载分隔符式的文本文件

data <- read.csv("datafile.csv")

数据集首行没有列名

data <- read.csv("datafile.csv",header = FALSE)

 R里bool型必须全大写TRUE,FALSE;Python里必须只有首字母大写True,False。

手动为列名赋值

name(data) <- c("Column1","Column2", "Column3")

 \t表示用制表符分隔

data <- read.csv("datafile.csv", sep = "\t")

 数据框将会自动将字符串存储为因子

data <- read.csv("datafile.csv",stringsAsFactors = FALSE)

 转换为factor

data$Sex <- factor(data$Sex)

read.csv()是对read.table()一个便捷的封装函数。更多的输入控制参见 ?read.table。 

1.4从Excel文件中加载数据

install.packages("xlsx")
library(xlsx)
data <- read.xlsx("datafile.xlsx",1) #读取Excel中第一张工作表
#指定
data <- read.xlsx("datafile.xlsx",sheetIndex = 1)
data <- read.xlsx("datafile.xlsx",sheetName = "Revenues")

#老版本 .xls
install.packages("gdata")
library(gdata)
data <- read.xls("datafile.xls")
data <- read.xls("datafile.xls", sheet = 2)

对于xlsx包,需要安装Java;对于gdata包,需要安装Perl。Perl在Linux和Mac OS X上是自带的,但在Windows上没有,需要后者自己安装ActiveState Perl

社区版本(免费)

如果嫌折腾,更简单的替代方案是打开Excel文件后另存为标准的文本格式,比如CSV。

1.5从SPSS文件中加载数据

install.packages("foreign")
library(foreign)
data <- read.spss("datafile.sav")

foreign包里其他的函数:

read.octave() : Octave & MATLAB。

read.systat() : SYSTAT。

read.xport() : SAS XPORT。

read.dta() : Stata。

输入ls("package:foreign")查看该包中所有函数的列表。

 

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

看星星的小白

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值