自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 R图 连续变量-作图

install.packages("ggExtra")library(ggExtra)piris <- ggplot(iris, aes(Sepal.Length, Sepal.Width, color = Species)) + geom_point(shape=21, size = 3,stroke = 1.2)+ scale_color_npg()+ theme_bw()+ theme(legend.position =

2022-02-08 16:02:12 851

原创 回归分析-线性回归-检验-模型

OLS:最小二乘法通过预测变量的加权和来预测量化的因变量,其中权重是通过数据估计而得的参数数据特征: 正态性 对于固定的自变量值,因变量值成正态分布。 独立性 Yi值之间相互独立。 线性 因变量与自变量之间为线性相关。 同方差性 因变量的方差不随自变量的水平不同而变化。也可称作不变方差回归模型包含一个因变量和一个自变量时,我们称为简单线性回归当只有一个预测变量,但同时包含变量的幂(比如,X、X 2、X 3)时,我们称之为多项式回归当有不止一个预测变量时,则称为多元线

2022-01-29 16:57:53 6329

原创 R-基础统计分析(无图)

描述性统计量mystats <- function(x, na.omit = FALSE) { if (na.omit) x <- x[!is.na(x)] m <- mean(x) n <- length(x) s <- sd(x) skew <- sum((x - m)^3/s^3)/n kurt <- sum((x - m)^4/s^4)/n - 3 return(c(n = n, m

2022-01-27 16:23:40 416 1

原创 R基本图形

##数据准备install.packages('vcd',repos='http://cran.us.r-project.org') library(grid) library(vcd) counts<- table(Arthritis$Improved)# simple bar plotbarplot(counts, main = "Simple Bar Plot", xlab = "Improvement", ylab = "Frequency")# stacked .

2022-01-27 10:19:59 376

原创 R作图-多图组合模式

opar <- par(no.readonly = TRUE)par(fig = c(0, 0.8, 0, 0.8))plot(mtcars$wt, mtcars$mpg, xlab = "Miles Per Gallon", ylab = "Car Weight")par(fig = c(0, 0.8, 0.55, 1), new = TRUE)boxplot(mtcars$wt, horizontal = TRUE, axes = FALSE)par(fig = c(0.65,

2022-01-26 15:11:40 493

原创 R数据整理2

options(digits=2)Student <- c("John Davis", "Angela Williams", "Bullwinkle Moose", "David Jones", "Janice Markhammer", "Cheryl Cushing", "Reuven Ytzrhak", "Greg Knox", "Joel England", "Mary Rayburn")Math <- c(502, 600, 412, 358,

2022-01-26 13:53:21 86

原创 R数据处理-base

//插入新数据mydata <- transform(mydata, sumx = x1 + x2, meanx = (x1 + x2)/2) //指定NAleadership$age[leadership$age==99]<- NA//新变量leadership <- within(leadership, { agecat <- NA agecat[age > 75] <- "Elder" agecat[age &gt.

2022-01-26 10:08:36 131

原创 R-实战1

##插入数据mydata<- data.frame(age=numeric(0),gender=character(0),weight=numeric(0))mydata<-edit(mydata)##绘图-存储pdf("mygraph.pdf")attach(mtcars)plot(wt,mpg)abline(lm(mpg~wt))title("Regression of MPG")detach(mtcars)dev.off()

2022-01-24 13:39:40 175

原创 GEO-R-获取数据

library(GEOquery)getGEOSuppFiles("GSE29450", baseDir ="geo", makeDirectory = T) # 新建一个文件夹//supp_url <- getGEOSuppFiles("GSE29450", fetch_files = F, makeDirectory = F)获取链接//download.file(url, destfile = "gse29450.tar")supp_url2 <- getGEOSuppFile.

2022-01-22 10:11:27 1064 1

原创 神经网络-理论

神经元模型#mermaid-svg-zq3ipjFp6wZmpFV5 .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-zq3ipjFp6wZmpFV5 .label text{fill:#333}#mermaid-svg-zq3ipjFp6wZmpFV5 .node rect,#mermaid-svg-zq3i

2022-01-21 15:38:24 393

原创 Apriori

性质:频繁项集非空子集必须也是频繁的##Apriori##arulesinstall.packages("arules")library(arules)data("Groceries")Groceriessummary(Groceries)freq=eclat(Groceries,parameter = list(support=0.06,maxlen=10))inspect(freq)model<-apriori(Groceries,parameter = list(suppo

2022-01-21 10:33:31 62

原创 聚类分析-关联规则

概述无监督的学习方式相近的归类–分类具有一定意义:无监督学习关键:亲疏关系:相似性与距离分类数确定:分多少类合适距离的度量:欧几里得距离:两个点坐标距离:曼哈顿距离:绝对轴距总和:切比雪夫距离:各坐标数值差的最大值明可夫斯基距离:多个距离公式的概括性表述dist(x)a bb 10.392305c 2.828427 10.770330ac距离更短相似性度量余弦相似性的度量:更注重在方向上的差异cos⁡θ=∑1n(Ai×Bi)∑1nAi2×∑1n

2022-01-21 10:07:34 1601

原创 决策树2-检验

评价性能:混淆矩阵:实际的类类1类2类1TPFNP类0FPTNNP:正例N:负TP:正确预测的正FP:负预测为正FN:正预测为负TN:正确预测的负准确度:Accuracy=(TP+TN)/(P+N)召回率:Recall=TP/P精确度:Precision=TP/(TP+FP)res<-predict(fit)result<-ifelse(res[,2]>0.5,"present","absent")a<.

2022-01-20 14:03:00 573

原创 data anlysis-决策树

聚类+偏差检测常见算法决策树:if else聚类:特征数据:非监督无便签数据自动分类时间序列朴素贝叶斯:基于概率:类别特征组合形成支持向量机:样本分开,拓展模型泛化性能关联规则:非监督学习,子集与子集之间的关系神经网络:演化为深度学习,多个简单地模块形成负责功能隐马尔科夫模型:状态之间独立变化,推算变化之间的关系回归遗传算法:仿生算法,模拟生物适应环境或适应目标函数的保底算法K-NH:简单高效 分类方式文本挖掘:自然然语言处理的集成高端算法:随机场、深度学习模型等tool

2022-01-20 11:31:34 681

原创 Logistic 回归

logistic 回归非线性回归模型在某种因素的作用下某种结果是否发生与线性回归的关系:将线性回归的结果映射到【0,1】Y为分类变量一个自变量与Y的关系:暴露在X状态下,结果y=1的概率:p(y=1∣x)=11+exp[−(β0+βx)]p(y=1|x)= \frac{1}{1+exp[-(\beta_0+\beta_x)]}p(y=1∣x)=1+exp[−(β0​+βx​)]1​z=β0+β1xz=\beta_0+\beta_1 x z=β0​+β1​xx 为确定性变量,不是随机的

2022-01-19 13:45:30 161

原创 R-统计学

均值:受到极端值影响大(通过去掉极端值)首尾去掉5%a<-runif(20)mean(a,trim = 0.05)a<-round(runif(20,0,10)) 取整数随机 round:取整几何平均数:适用于原始数据不对称中位数:递增排序后的数据中,不受极端值影响众数names(x)[x==max(x)]方差var(a) 样本的方差:n-1总结五数最小 第一四分位 中位 第三四分位 最大fivenum(a)boxplot(a) 箱线图茎叶图看频数stem(

2022-01-18 16:54:27 461

原创 【无标题】字符串

char*指针指向一串连续的字节char* =“hello” 存在代码段; char word[]=“hello” 存在变量段;char* 后有"\0",则代表所指处为字符串char *string;是一个指针变量,并未初始化。------------------------------char buffer[100]="";是一个空字符串,buffer[0]=='\0';------------------------------char**a;a是一个指针,指向另一个指针,指针

2022-01-11 08:13:47 80

原创 【无标题】

C语言学习笔记

2022-01-10 15:36:10 42

原创 Linux入门

Linux入门20210327第四堂课,学完基本命令图片图片:

2021-03-27 16:24:11 35

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除