自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 R语言学习(八)——数据缺失值处理

步骤:1.识别缺失值2.分析缺失的原因3.查看缺失值情况4.处理缺失值识别判断缺失值:is.na()识别矩阵或数据框中的完整观测:complete.cases()例:any(is.na(data)):检查是否存在缺失值head(is.na(datacol1),5):查看数据data中col1列前5个数据的缺失情况sum(is.na(datacol1),5):查看数据data中c...

2018-11-09 16:35:35 12593 1

原创 R语言学习(七)——数据规范化

标准化(1)caret包中:preProcess(x, …)(2)R内置scale()函数

2018-10-27 21:22:36 1373

原创 R语言学习(六)——dplyr包常用函数

filter():筛选满足条件的行例:利用R中自带包“survey”进行数据处理等同于:这种方法产生的数据框可能带有缺失值arrange():排序当排序列有多个,前面的列有更高的排序优先级,默认从小到大的顺序,逆序要指定desc(var)或-var,var表示要排序的变量名。例:arrange(survey,Height,-Wr.Hnd)或arrange(survey,Heig...

2018-10-25 20:20:18 2564

原创 Pycharm问题解决——包已经下载,但是运行代码提示找不到模块

问题产生:pycharm→settings→Project interpreter→下载matplotlib包运行代码,出现以下提示:找不到‘matplotlib’模块ModuleNotFoundError: No module named ‘matplotlib’检查路径:没有错误……让我们试试下面的步骤:右上角,点击Edit Configuration:发现Python i...

2018-10-24 16:52:39 13247 4

原创 R语言学习(五)——基本函数、运算符、日期值转换

处理数据对象的函数(一)length():成分数量mode():数据的存储属性typeof():数据的存储类型(比mode()更细致)class():返回变量的数据结构dim():维度str():结构head():列出前6行数据tail():列出后6行数据rm(, , ,):删除一个或对个对象rm(list=Is()):删除当前工作环境所有对象names():各成分名称c...

2018-10-24 11:02:47 1381

原创 R语言学习(四)——泊松分布

dpois(x, lambda, log = FALSE)ppois(q, lambda, lower.tail = TRUE, log.p = FALSE)qpois(p, lambda, lower.tail = TRUE, log.p = FALSE)rpois(n, lambda)lower.tail = FALSE允许在默认情况下获得更精确的结果,lower.tail = TRU...

2018-10-23 21:06:24 26056

原创 R语言学习(三)——二项分布

二项分布统计推断dbinom(x, size, prob):计算某点的概率值x:生成随机数的数量;size:伯努利实验的次数;prob:试验成功的概率pbinom(q, size, prob):生成累积概率qbinom(p, size, prob):生成分位数rbinom(n, size, prob):生成随机数例:P(X=5)=dbinom(5,20,.5)P(X≥8)=1-P(...

2018-10-23 20:22:24 9870

原创 R语言学习笔记(二)——melt()函数之整齐数据

R语言学习(二)melt()函数melt(data,id.vars,measure.vars,variable.name=“variable”,…,na.rm=FALSE,value.name=“value”,factorsAsStrings=TRUE)id.vars:标识变量(依旧在列上,位置保持不变的变量)measure.vars:度量变量(需要放进同一列的变量)variable.n...

2018-10-22 19:01:40 21006 1

原创 R语言学习笔记(一)--由样本质量(K-L信息量)求系统抽样下的最优样本量

R语言学习笔记—由样本质量(K-L信息量)求系统抽样下的最优样本量样本质量样本质量表现的是样本结构与整体数据结构的相似性。对于离散型数据,整体数据集设为D,S设为按照特定抽样方法从整体D中抽取的样本数据,频率分布如下:Xx1x2…xk频数n1n2…nk频率fs1fs2…fsk用K-L信息量基于频率来衡量数据集S和D的差异性:I(S,D...

2018-10-22 18:30:07 2791

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除