![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R
爱知菜
Renjie Wei
展开
-
R 语言 绘制横向的直方图(条状图)
barplot(rev(qs$ppp),horiz=T,xlim=c(-4,1),axes=F,col=rep(brewer.pal(9,'YlOrRd'),each=15))text(seq(from=0.7,length.out=135,by=1.2),x=-2,label=rev(qs$nnn))axis(3,c(0,0.25,0.5,0.75,1),c('0%','25%','50%'原创 2014-10-16 15:47:22 · 27471 阅读 · 6 评论 -
Kaggle 上一个用户分类问题
kaggle redhat featurehashing xgboost原创 2017-04-13 00:04:04 · 1901 阅读 · 0 评论 -
python利用K均值做聚类,判断中国足球第几流
python R 聚类原创 2013-04-05 16:49:33 · 4193 阅读 · 3 评论 -
R package: Caret
caret原创 2017-04-09 23:42:03 · 1393 阅读 · 0 评论 -
Weka Explorer(探索者界面) 详解(4)logistic回归和回归算法
logistic回归和回归算法原创 2013-09-06 18:16:18 · 18844 阅读 · 0 评论 -
提高 分类器 准确率的几种方法总结(装袋,提升,随机森林)
一、装袋对样本空间 D 进行 放回抽样,得到样本空间的一个子集 Di,由Di得到一个 分类器Mi。不断的重复上述过程,就可以得到一系列分类器 M1,M2,M3....Mi ,在分类时用这些分类器进行投票来决定分类。二、提升和AdaBoost对长度为d的训练样本空间 D 的每一个元组分配一个初始的权限 1/d, 然后开始一个迭代的过程:根据元组的权限来作为抽取概率原创 2013-05-30 12:09:05 · 11064 阅读 · 0 评论 -
kaggle bike sharing program R code tranlated from python code ranked 9th
R code kaggle bike sharing原创 2015-08-13 14:29:55 · 1068 阅读 · 0 评论 -
统计学一些知识的总结:qq图, 肥尾分布, 置信区间
Q-Q图http://bioinformatics.lofter.com/post/bffd5_23f5fe原创 2014-07-21 16:54:30 · 22040 阅读 · 1 评论 -
R语言 股价分析
首先判断股价的分布是不是正态分布:#获取3m公司收盘价mmmdata = read.csv("E:\\kuaipan\\A Introduction to Analysis of Financial Data with R\\chapter 1\\ch1data\\d-mmm-0111.txt",header = T)mmmprice = as.numeric(sapply(mmmdata原创 2015-09-09 15:39:47 · 2328 阅读 · 0 评论 -
概率论几大分布和统计学三大检测简述
二项分布二项分布是一个离散概率分布在n次独立的实验中, 事件A 发生的概率为p(不发生的概率则为1-p),那么最终事件A 发生k(k大于等于0,小于等于n)次的概率为:nCk * p^k * (1-p)^(n-k)其中 nCk 的意思是 组合(n中取k)泊松分布泊松分布是二项分布的一个变形和取极限,它通常被用来描述一段时间内或者一定空间内事件的发生次原创 2013-08-19 17:00:00 · 20101 阅读 · 1 评论 -
R语言 备忘录
.Last.value 获取上一次结果值产生等差序列用seq函数na.omit 函数可以返回一个去掉NA值的序列获取一个dataset的行数可以用nrow函数从一个数据集里去掉第21,23行,d有个函数叫 manyNAs , 可以从dataset里得到有较多 NA的行号。在一个函数的参数列表中, 有一种参数用三个点表示, 它代表所有未命名参数的合集, 用于赋给内部的函数typeof函数得到具体的类原创 2014-10-13 21:13:05 · 1320 阅读 · 0 评论