R语言之导入数据源(二)

本文介绍了R语言中导入各种类型数据的方法,包括XML数据、网页抓取、SPSS数据、SAS数据和Stata数据。提供了相关包和函数的使用示例,如XML包、RCurl、foreign包、Hmisc包和RODBC包。此外,还提到了值标签的创建,如将类别型变量gender的1和2分别标记为男性和女性。
摘要由CSDN通过智能技术生成

4 导入XML数据

   R中有若干用于处理XML文件的包。例如,由Duncan Temple Lang编写的XML包允许用户读取、写入和操作XML文件。详情参阅

5 从网页抓取数据

   在web数据抓取(Webscraping)的过程中,用户从互联网上提取嵌入在网页中的信息,并将其保存为R中的数据结构以做进一步的分析。使用函数readLines()下载网页,然后使用如grep()和gsup()一类的函数处理它。对于结构复杂的网页,可以使用RCurl和XML包来提取其中想要的信息。详情参阅中的"Webscraping using readLines and RCurl"一文。

6 导入SPSS数据

   SPSS数据集可以通过foreign包中的函数read.spss()导入R中,也可以使用Hmisc包中的spss.get()函数。spss.get()函数是read.spss()的一个封装。代码:

> library(Hmisc)
载入需要的程辑包:lattice
载入需要的程辑包:survival
载入需要的程辑包:Formula
载入需要的程辑包:ggplot2

载入程辑包:‘Hmisc’

The following objects are masked from ‘package:base’:

    format.pval, round.POSIXt, trunc.POSIXt, u
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值