- 博客(5)
- 问答 (1)
- 收藏
- 关注
原创 R语言学习日常1——数据分析项目的流程
从结果中可以看到,构建的模型是随机森林的分类模型,一共生成了500棵决策树,OOB estimate of error rate(包括估计误差)是4%,误差比较小。结果还给出了训练数据的混淆矩阵,从混淆矩阵中可以发现,3个virginica被模型错判为versicolor,3个versicolor被错判为virginica。其中,有监督的问题往往包括以下三方面:分类问题(将不同的样本归属于不同的类别);可以看到,模型的误差为4.67%,这意味着模型有一个比较好的预测效果。、评估模型:模型的预测结果;
2023-04-21 21:09:22 426 2
原创 分布的可加性
1、二项分布:若X~b(n,p),Y~b(m,p),则Z=X+Y~b(n+m,p)。若同一类分布的独立随机变量和的分布仍属于此类分布,则称此类分布具有可加性。注意:这里要求这两个二项分布中的参数P要相同。具有可加性的常用分布:前提X和Y独立。两个伽马分布中的尺度参数。
2023-04-03 15:38:16 6755 1
原创 列联表中的相关测量(卡方值与相关系数之间的转换)
是描述2×2列联表数据相关程度最常用的一种相关系数。Φ无上限,C系数小于1的情况,格莱姆提出了V相关系数。2、列联相关系数,简称C系数,主要用于列联表大于。注:内容来源于贾俊平《统计学》
2023-04-02 16:55:00 4088 1
空空如也
关于双边贸易总额的相关数据问题
2022-03-09
TA创建的收藏夹 TA关注的收藏夹
TA关注的人