R/RStudio 常用函数

首先说明:R是运行环境,RStudio是开发工具。RStudio是为了方便使用R语言而诞生的,他能方便代码的编辑、调试以及图形的显示。

1.查看当前f工作路径: getwd()
2.设置当前工作路径: setwd()
3.查看数据类型: class()

4.新建数据框
a <- data.frame(GeneId = rep(“gene5”,times=3),SampleName = paste(“Sample”,1:3,sep=""), Expression = c(14,19,18))

5.commandArgs(),是R自带的参数传递函数,属于位置参数。

6.用source函数代替繁冗的R语言打包过程
例如我们写下下面的函数
matchar <- function(name) {

name = unlist(name)

name = as.character(name)

return(name)

}

将它保存为matchar.r

如果他的保存路径为C:\pa

那么下次调用这个函数时,不必重新定义

只要

path=“C:/pa” #声明matchar.r所在位置

setwd(path) #把工作路径设置到path

source(‘matchar.r’) #“预装“函数

这时候如果你输入matchar

R工作台就成显示matchar函数的代码,说明预装成功,可以使用了。

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
RStudio是一个用于统计分析和编程的集成开发环境(IDE),它提供了用于数据分析、可视化和建模的强大工具和功能。 TF-IDF是一种文本挖掘中常用的特征提取方法,全称为Term Frequency-Inverse Document Frequency(词频-逆文档频率)。 在RStudio中,我们可以使用不同的包来计算和应用TF-IDF。其中,tm包是一个常用的文本挖掘包,可以用于处理文本语料库。 首先,我们需要将文本数据加载到RStudio中。可以使用readLines()方法将文本文件读取为一个字符向量,或者使用read.csv()方法读取一个包含文本数据的CSV文件。 接下来,我们需要对文本进行预处理,包括去除特殊字符和停用词,以及进行分词和词干提取。可以使用tm包中的函数来完成这些任务,例如使用tm_map()方法将文本转换为小写,或者使用removePunctuation()方法去除标点符号。 然后,我们可以使用TermDocumentMatrix()函数将文本转换为文档-词条矩阵。这个函数会将文本数据转换为一个稀疏矩阵,其中每行代表一个文档,每列代表一个词条,矩阵中的元素表示该词条在该文档中出现的频率。 接着,我们可以使用weightTfIdf()函数计算TF-IDF权重。这个函数会根据文档-词条矩阵中的词频信息和词条的逆文档频率信息,计算每个词条的TF-IDF权重。 最后,我们可以将TF-IDF权重应用于其他文本挖掘任务,如聚类分析、文本分类和信息检索等。可以使用kmeans()函数对文档进行聚类,或者使用RandomForest()函数构建文本分类模型。 总之,RStudio是一个强大的集成开发环境,可以方便地进行文本挖掘任务。通过使用RStudio中的包和函数,我们可以轻松计算和应用TF-IDF,并将其应用于其他文本挖掘任务中。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值