- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 KNN 回归模型的认识与使用
KNN模型,是一种紧邻算法,也叫K紧邻(K-Nearest-Neighbor),在数据挖掘算法中是最简单并且基础的一种算法模型,在实际的运用中,不仅有分类方面的应用,也有回归方面的应用。本文从回归预测的角度出发,来介绍一下KNN算法。
2022-12-09 00:47:27 1954 1
原创 科学配色作图——R包ggsci
科学配色作图——R包ggsciggsci包新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入ggsci包ggsci是ggplot的主题包,它提供一系列高质量的调色板,其灵感来自于科学期刊、数据可视化库、科幻电影和电视节目中
2021-10-15 19:16:50 1780
原创 浅谈共线性的产生以及解决方法(下篇——来世)
浅谈共线性的产生以及解决方法(下篇——来世)上篇对共线性问题的诊断以及消除做了详尽的介绍,那么如何与实际场景结合呢?(1)数据来源该数据来源于《1994年统计摘要》1978-1993年的中国民航客运量统计数据。(2)变量介绍Y——民航客运量(万人)X1——国民收入(亿元)X2——消费额(亿元)X3——铁路客运量(万人)X4——民航线里程(万公里)X5——来华旅游入境人数(万人)对数据进行多元线性回归模型的拟合,看下效果我们可以根据方差膨胀因子判别多元线性模型是否存在共线性问题,上述
2020-10-29 23:48:04 1421 4
原创 浅谈共线性的产生以及解决方法(中篇——今生)
浅谈共线性的产生以及解决方法(下篇——今生)上篇我们讲到共线性概念以及共线性问题存在时对模型的影响。那么如何对样本数据中存在的共线性问题进行诊断呢?3 多重共线性的诊断方法3.1 相关系数法对于一个样本数据集,我们要了解解释变量,相关系数是一个重要的参数。假设样本中有x1x_{1}x1,x2x_2x2,x3x_3x3,…,xpx_pxp这些变量,两个变量间的相关系数:R=∑i=1n(xi−xˉ)(yi−yˉ)∑i=1n(xi−xˉ)2∑i=1n(yi−yˉ)2R=\frac{\sum_{i
2020-10-15 21:25:47 6408 2
原创 浅谈共线性的产生以及解决方法(上篇——前世)
标题:浅谈共线性的产生以及解决方法(上篇——前世)1. 多元线性回归模型在线性相关条件下,两个或两个以上解释变量对一个被解释变量的数量变化关系,称之为多元线性回归分析,由多元线性回归分析得到的数学表达式称为多元线性回归模型。一般我们认为,多元线性回归问题中涉及的数据由被解释变量Y和p个解释变量x1x_{1}x1,x2x_2x2,x3x_3x3,…,xpx_pxp的n次观测组成,如下表所示: 多元线性回归模型的一般形式为:y=β0β_0β0+β1
2020-10-07 19:44:59 2408 6
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人