4 导入XML数据
R中有若干用于处理XML文件的包。例如,由Duncan Temple Lang编写的XML包允许用户读取、写入和操作XML文件。详情参阅
5 从网页抓取数据
在web数据抓取(Webscraping)的过程中,用户从互联网上提取嵌入在网页中的信息,并将其保存为R中的数据结构以做进一步的分析。使用函数readLines()下载网页,然后使用如grep()和gsup()一类的函数处理它。对于结构复杂的网页,可以使用RCurl和XML包来提取其中想要的信息。详情参阅中的"Webscraping using readLines and RCurl"一文。
6 导入SPSS数据
SPSS数据集可以通过foreign包中的函数read.spss()导入R中,也可以使用Hmisc包中的spss.get()函数。spss.get()函数是read.spss()的一个封装。代码:
> library(Hmisc)
载入需要的程辑包:lattice
载入需要的程辑包:survival
载入需要的程辑包:Formula
载入需要的程辑包:ggplot2
载入程辑包:‘Hmisc’
The following objects are masked from ‘package:base’:
format.pval, round.POSIXt, trunc.POSIXt, u