![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R
文章平均质量分 51
chenjunjun2022
业余码农
展开
-
R图 连续变量-作图
install.packages("ggExtra")library(ggExtra)piris <- ggplot(iris, aes(Sepal.Length, Sepal.Width, color = Species)) + geom_point(shape=21, size = 3,stroke = 1.2)+ scale_color_npg()+ theme_bw()+ theme(legend.position =原创 2022-02-08 16:02:12 · 878 阅读 · 0 评论 -
回归分析-线性回归-检验-模型
OLS:最小二乘法通过预测变量的加权和来预测量化的因变量,其中权重是通过数据估计而得的参数数据特征: 正态性 对于固定的自变量值,因变量值成正态分布。 独立性 Yi值之间相互独立。 线性 因变量与自变量之间为线性相关。 同方差性 因变量的方差不随自变量的水平不同而变化。也可称作不变方差回归模型包含一个因变量和一个自变量时,我们称为简单线性回归当只有一个预测变量,但同时包含变量的幂(比如,X、X 2、X 3)时,我们称之为多项式回归当有不止一个预测变量时,则称为多元线原创 2022-01-29 16:57:53 · 6443 阅读 · 0 评论 -
R-基础统计分析(无图)
描述性统计量mystats <- function(x, na.omit = FALSE) { if (na.omit) x <- x[!is.na(x)] m <- mean(x) n <- length(x) s <- sd(x) skew <- sum((x - m)^3/s^3)/n kurt <- sum((x - m)^4/s^4)/n - 3 return(c(n = n, m原创 2022-01-27 16:23:40 · 434 阅读 · 1 评论 -
R基本图形
##数据准备install.packages('vcd',repos='http://cran.us.r-project.org') library(grid) library(vcd) counts<- table(Arthritis$Improved)# simple bar plotbarplot(counts, main = "Simple Bar Plot", xlab = "Improvement", ylab = "Frequency")# stacked .原创 2022-01-27 10:19:59 · 385 阅读 · 0 评论 -
R作图-多图组合模式
opar <- par(no.readonly = TRUE)par(fig = c(0, 0.8, 0, 0.8))plot(mtcars$wt, mtcars$mpg, xlab = "Miles Per Gallon", ylab = "Car Weight")par(fig = c(0, 0.8, 0.55, 1), new = TRUE)boxplot(mtcars$wt, horizontal = TRUE, axes = FALSE)par(fig = c(0.65,原创 2022-01-26 15:11:40 · 508 阅读 · 0 评论 -
R数据整理2
options(digits=2)Student <- c("John Davis", "Angela Williams", "Bullwinkle Moose", "David Jones", "Janice Markhammer", "Cheryl Cushing", "Reuven Ytzrhak", "Greg Knox", "Joel England", "Mary Rayburn")Math <- c(502, 600, 412, 358,原创 2022-01-26 13:53:21 · 110 阅读 · 0 评论 -
R数据处理-base
//插入新数据mydata <- transform(mydata, sumx = x1 + x2, meanx = (x1 + x2)/2) //指定NAleadership$age[leadership$age==99]<- NA//新变量leadership <- within(leadership, { agecat <- NA agecat[age > 75] <- "Elder" agecat[age >.原创 2022-01-26 10:08:36 · 136 阅读 · 0 评论 -
R-实战1
##插入数据mydata<- data.frame(age=numeric(0),gender=character(0),weight=numeric(0))mydata<-edit(mydata)##绘图-存储pdf("mygraph.pdf")attach(mtcars)plot(wt,mpg)abline(lm(mpg~wt))title("Regression of MPG")detach(mtcars)dev.off()原创 2022-01-24 13:39:40 · 179 阅读 · 0 评论 -
GEO-R-获取数据
library(GEOquery)getGEOSuppFiles("GSE29450", baseDir ="geo", makeDirectory = T) # 新建一个文件夹//supp_url <- getGEOSuppFiles("GSE29450", fetch_files = F, makeDirectory = F)获取链接//download.file(url, destfile = "gse29450.tar")supp_url2 <- getGEOSuppFile.原创 2022-01-22 10:11:27 · 1133 阅读 · 1 评论 -
神经网络-理论
神经元模型#mermaid-svg-zq3ipjFp6wZmpFV5 .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-zq3ipjFp6wZmpFV5 .label text{fill:#333}#mermaid-svg-zq3ipjFp6wZmpFV5 .node rect,#mermaid-svg-zq3i原创 2022-01-21 15:38:24 · 396 阅读 · 0 评论 -
Apriori
性质:频繁项集非空子集必须也是频繁的##Apriori##arulesinstall.packages("arules")library(arules)data("Groceries")Groceriessummary(Groceries)freq=eclat(Groceries,parameter = list(support=0.06,maxlen=10))inspect(freq)model<-apriori(Groceries,parameter = list(suppo原创 2022-01-21 10:33:31 · 66 阅读 · 0 评论 -
聚类分析-关联规则
概述无监督的学习方式相近的归类–分类具有一定意义:无监督学习关键:亲疏关系:相似性与距离分类数确定:分多少类合适距离的度量:欧几里得距离:两个点坐标距离:曼哈顿距离:绝对轴距总和:切比雪夫距离:各坐标数值差的最大值明可夫斯基距离:多个距离公式的概括性表述dist(x)a bb 10.392305c 2.828427 10.770330ac距离更短相似性度量余弦相似性的度量:更注重在方向上的差异cosθ=∑1n(Ai×Bi)∑1nAi2×∑1n原创 2022-01-21 10:07:34 · 1645 阅读 · 0 评论 -
决策树2-检验
评价性能:混淆矩阵:实际的类类1类2类1TPFNP类0FPTNNP:正例N:负TP:正确预测的正FP:负预测为正FN:正预测为负TN:正确预测的负准确度:Accuracy=(TP+TN)/(P+N)召回率:Recall=TP/P精确度:Precision=TP/(TP+FP)res<-predict(fit)result<-ifelse(res[,2]>0.5,"present","absent")a<.原创 2022-01-20 14:03:00 · 588 阅读 · 0 评论 -
data anlysis-决策树
聚类+偏差检测常见算法决策树:if else聚类:特征数据:非监督无便签数据自动分类时间序列朴素贝叶斯:基于概率:类别特征组合形成支持向量机:样本分开,拓展模型泛化性能关联规则:非监督学习,子集与子集之间的关系神经网络:演化为深度学习,多个简单地模块形成负责功能隐马尔科夫模型:状态之间独立变化,推算变化之间的关系回归遗传算法:仿生算法,模拟生物适应环境或适应目标函数的保底算法K-NH:简单高效 分类方式文本挖掘:自然然语言处理的集成高端算法:随机场、深度学习模型等tool原创 2022-01-20 11:31:34 · 692 阅读 · 0 评论 -
Logistic 回归
logistic 回归非线性回归模型在某种因素的作用下某种结果是否发生与线性回归的关系:将线性回归的结果映射到【0,1】Y为分类变量一个自变量与Y的关系:暴露在X状态下,结果y=1的概率:p(y=1∣x)=11+exp[−(β0+βx)]p(y=1|x)= \frac{1}{1+exp[-(\beta_0+\beta_x)]}p(y=1∣x)=1+exp[−(β0+βx)]1z=β0+β1xz=\beta_0+\beta_1 x z=β0+β1xx 为确定性变量,不是随机的原创 2022-01-19 13:45:30 · 165 阅读 · 0 评论 -
R-统计学
均值:受到极端值影响大(通过去掉极端值)首尾去掉5%a<-runif(20)mean(a,trim = 0.05)a<-round(runif(20,0,10)) 取整数随机 round:取整几何平均数:适用于原始数据不对称中位数:递增排序后的数据中,不受极端值影响众数names(x)[x==max(x)]方差var(a) 样本的方差:n-1总结五数最小 第一四分位 中位 第三四分位 最大fivenum(a)boxplot(a) 箱线图茎叶图看频数stem(原创 2022-01-18 16:54:27 · 468 阅读 · 0 评论