![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
零基础
自律的萱小主
在读女博士;学学python,SQL,R;金融数据分析、金融风险建模
展开
-
Lesson 1: 数学计算符
符号功能t()转置matrix(4:6, nrow=1, ncol=3)矩阵crossprod(x,y)内积tcrossprod(x,y)外积A*B矩阵对应元素相乘solve(A)逆矩阵eigen(H)$values特征值eigen(H)$vectors特征向量原创 2021-12-28 00:39:58 · 295 阅读 · 0 评论 -
作业二:R语言画gamma分布图
################gamma分布图######################a<-c(1,5,10)b<-c(0.5,1,2)par(mfrow=c(1,3))for(i in 1:3){plot(seq(0,(3.8a[i]),0.3),dgamma(seq(0,(3.8a[i]),0.3),a[i],1/b[1]),main=substitute(Gamma(a,b),list(a=a[i])), ylab=“P”,xlab=“x”,type=“l”, col=“b原创 2021-12-28 00:39:20 · 2287 阅读 · 0 评论 -
应用统计分析作业四:数据框中因子型数据的处理
library(foreign)df<-read.spss("meph.sav ",to.data.frame=TRUE)###1. 将white与others合并为一个变量attach(df)contrasts(df$RACE1)# 语句只能用于factor(因子型)levels(df$RACE1) <- list("WHITE"=c("others","white"),"BLACK"="Black","NATIVE"="Native","ASIAN"="Asian")contr原创 2021-12-28 00:37:55 · 248 阅读 · 0 评论 -
R语言作业一:矩估计、极大似然估计、拟合、对数正态分布、泊松分布、负二项分布
一、矩估计、极大似然估计、拟合、对数正态分布##导入数据setwd("C:/Users/chang/Documents/SRM-PA/R简介/上课练习数据集")healthexpend <- read.csv(file="HealthExpend.csv",header=T)##取其中EXPENDOP>0的数据,记为EXPENDOPattach(healthexpend)EXPENDOP<- healthexpend$EXPENDOP[EXPENDOP>0]EXPEN原创 2021-12-26 14:01:43 · 6958 阅读 · 0 评论 -
Lesson 10 : 主成分分析和因子分析
一、主成分分析1、查看数据是否完整library(psych)complete.cases(USJudgeRatings)2、判断主成分个数: 碎石图fa.parallel(USJudgeRatings[,-1],fa="pc",n.iter=100,show.legend=F,main="Picture")# n.iter模拟100个随机数据矩阵,生成虚线# fa=主成分(pc),因子(fa),两个(both)abline(h=1,lty=1,col="black")# 超过虚线或ab原创 2021-12-25 19:52:05 · 1953 阅读 · 0 评论 -
Lesson 11:聚类分析
缩放数据data(nutrient, package=“flexclust”)df1 <- apply(nutrient, 2, function(x){(x-mean(x))/sd(x)})df2 <- apply(nutrient, 2, function(x){x/max(x)})df3 <- apply(nutrient, 2, function(x){(x-mean(x))/mad(x)})MAD(X)=median(abs(Xi−median(X)))...原创 2021-12-25 16:24:31 · 668 阅读 · 0 评论 -
Lesson 9 : Logit 回归
一、广义线性模型glm(formula, family=binomial(link="logit"), data=df)分 布 族默认的连接函数binomiallink = “logit”gaussianlink = “identity”gammalink = “inverse”二、Logit 回归1、步骤Step 1 定义因变量把出轨次数转为是否出轨(0,1),再转化成名义型因子才可以作为Logit回归的因变量。data(Affairs, pack原创 2021-12-24 13:32:36 · 853 阅读 · 0 评论 -
Lesson 8:回归
一、回归1、基准模型fit<-lm(Y~X, data)交互项fit<-lm(Y ~ X1:X2+I(X2^2)+X1+X2+X3, data)展示交互项的结果install.packages("effects")library(effects)fit1 <- lm(EXPENDOP ~ AGE:GENDER+AGE+GENDER,data=df)plot(effect("AGE:GENDER", fit1,, list(AGE=c(22,32,42))), mult原创 2021-12-23 21:55:38 · 647 阅读 · 0 评论 -
Lesson 7:绘制统计图
准备:绘图的开始与结束语句dev.new() # 打开一个新窗口,这样就不会覆盖掉原来的图png("regress.png") # 填写设置参数的代码,见1# 填写绘图的代码,见2-6dev.off() # 关闭这个窗口1、设置参数设置图片内的线条、点opar <- par(no.readonly=TRUE)# 以生成可供修改的图形参数列表par(lty=2, pch=17, lwd=2, cex=2, col="red",bg="blue") 参数含义lt原创 2021-12-23 13:45:44 · 689 阅读 · 0 评论 -
Lesson6: 列联表与频数表、独立性检验
1、一维列联表展示年龄的所有取值table(df$AGE) 比例:展示每个年龄的分布比例prop.table(table(df$AGE))2、二维列联表计数:每个人种–年龄对应的人数t1 <- table(df$AGE, df$RACE1)计数:按行/列方向求和margin.table(t1, 1) # 1表示按行加和,即每个年龄的人数margin.table(t1, 2) # 2表示按列加和,即每个人种的人数比例prop.table(t1)每行/列中各部分所占比例原创 2021-12-21 21:58:36 · 496 阅读 · 0 评论 -
Lesson 5: 函数
1、计算长度和维度length(x) # 长度dim(x) # 长宽维度注:如果是2 * 2矩阵,length返回4;``返回长宽,2 * 2矩阵,dim返回2 22、分割连续型变量cut(x, n)将连续型变量 x 分割为有着 n 个水平的因子3、参数:创建有序型因子ordered_result = TRUE 4、给单个变量排序sort(x,decreasing=TRUE) 5、apply()数组按行求均值,如果按列求均值,改为margin=0apply(df, marg原创 2021-12-21 20:33:49 · 94 阅读 · 0 评论 -
Lesson3: DataFrame中的数据处理操作
1、根据条件筛选行和列既筛选行又筛选列names(df) # 快速查看所有变量名,方便复制df1 <- subset(df, EXPENOD>0, select<-c("AGE","ANYLIMIT","COLLEGE","HIGHSCH", "GENDER"))只筛选行df1 <- subset(df,ANYLIMIT==1)# 或者df1 <- df[df$ANYLIMIT==1,]只筛选列df1 <- subset(df,select=AGE:原创 2021-12-20 12:07:11 · 226 阅读 · 0 评论