R语言学习笔记
R语言学习笔记
ww0peo
这个作者很懒,什么都没留下…
展开
-
R语言笔记⑨——本文挖掘
文本挖掘若要机器对文本进行理解,就需要对文本进行分词,进而变成机器可以理解的单个词语。在处理大量文档的是否,还需要进行词语向量化,进而进行后面的文本挖掘计算。Rwordseg包如果想要安装Rwordseg包需要先安装rjava包,rjava包的安装需要jre环境。Rwordseg包中文分词最显著的特点是它会先将标量符号去除,再进行分词,这样处理的结果是可能标点符号前后的文字会连起来影响分词效...原创 2020-03-01 22:04:37 · 714 阅读 · 2 评论 -
R语言笔记⑧——数据挖掘算法
数据挖掘算法聚类算法kmeans算法原创 2020-03-01 22:04:26 · 1784 阅读 · 2 评论 -
R语言笔记⑦——向量、矩阵、数组、列表、数据框、因子、时间与日期
向量c函数> c(1,2,3,4,5,6)[1] 1 2 3 4 5 6> c(1:6)[1] 1 2 3 4 5 6> c('dfasf','asfsa','fasdf')[1] "dfasf" "asfsa" "fasdf"> c(TRUE,FALSE,T,F)[1] TRUE FALSE TRUE FALSE原创 2020-03-01 22:04:11 · 781 阅读 · 0 评论 -
R语言笔记⑥——网络爬虫
爬虫假设有如下页面下面将新闻的内容提取出来> url <- 'https://mbd.baidu.com/newspage/data/landingsuper?context=%7B"nid"%3A"news_9194136950339436704"%7D&n_type=0&p_from=1'> web <- read_html(url,enc...原创 2020-03-01 22:04:00 · 2325 阅读 · 1 评论 -
R语言笔记⑤——字符串函数
字符查找函数grep函数,可以返回匹配项的下标> s <- c('123abc4456','abcdsaf')> s[1] "123abc4456" "abcdsaf" > grep('abc',s)[1] 1 2grepl函数则返回TRUE> s <- c('123abc4456','abcdsaf')> s[1] "123a...原创 2020-03-01 22:03:49 · 1334 阅读 · 0 评论 -
R语言笔记④——数值摘要、缺失值、数据标准化、线性回归、多元线性回归和主成分分析
数据探索反映集中程度的函数> a <- c(1,5,6,9,7,5,6,7,2,6)> mean(a)[1] 5.4> median(a)[1] 6> quantile(a) 0% 25% 50% 75% 100% 1.00 5.00 6.00 6.75 9.00 反映数据分散程度的函数> a <- c(1,5,6,9,...原创 2020-03-01 22:03:37 · 5727 阅读 · 1 评论 -
R语言笔记③——常用函数、基本数据集、帮助介绍和调试方法
常用函数实现一个众数函数> mode <- function(x){+ return(as.numeric(names(table(x))[table(x) == max(table(x))]))+ }> mode(c(1,2,2,2,3,3,6,6))[1] 2source()函数可以实现加载外部函数的功能如果我们编写了自定义的函数,但是想要使用的话,每一...原创 2020-03-01 22:03:23 · 1201 阅读 · 0 评论 -
R语言笔记②——基本绘图、快速绘图和保存图片
基本绘图plot()函数可以画出散点图或者直线图> x <- c(1:3)> y <- x + 2.5> plot(x,y)> plot(x,y,type = 'l')barplot()函数可以画出条形图barplot(c(88,79,99),names.arg = c('小明','小红','小刘'),ylim = c(0,100))...原创 2020-03-01 22:03:06 · 7626 阅读 · 0 评论 -
R语言笔记①——函数、管道函数和文件读取与写入
函数function关键字创建函数return关键字返回值f <- function(x){ print(x)}f1 <- function(x,y){ return(x+y)}管道函数%>%将一个对象传递到一个函数中> library(magrittr)> f <- function(x){+ print(x)+ }...原创 2020-03-01 22:02:56 · 1218 阅读 · 0 评论