- 博客(3)
- 收藏
- 关注
原创 众数插值法
自定义众数函数stat.mode <- function(x, rm.na = TRUE){ if (rm.na == TRUE){ y = x[!is.na(x)] } res = names(table(y))[which.max(table(y))] return(res) }自定义函数,实现分组替补my.impute <- function(data, c
2017-01-20 11:17:59 2126
原创 哑变量的处理
将几个离散变量转换为因子,目的便于下面一次性处理哑变量final_housecluster<−factor(clust cluster <- factor(clustcluster) final_housefloow<−factor(final h ouse floow <- factor(final_housefloow) final_housetype.new<−factor(final h
2017-01-20 11:00:25 3651
原创 k-means的分类数目
k-means聚类的类数确定根据类内离差平方和最小,类间离差平方和最大的原则自定义函数tot.wssplot <- function(data, nc, seed=1234){ #假设分为一组时的总的离差平方和 tot.wss <- (nrow(data)-1)*sum(apply(data,2,var)) for (i in 2:nc){ #必须指定随机种子数
2017-01-20 10:58:31 2944
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人