统计学习
学无止境灬博学笃思
这个作者很懒,什么都没留下…
展开
-
R语言第十一讲 决策树与随机森林
概念 决策树主要有树的回归和分类方法,这些方法主要根据分层和分割的方式将预测变量空间划分为一系列简单区域。对某个给定待预测的观 测值,用它所属区域中训练集的平均值或众数对其进行预测。 基于树的方法简便且易于解释。但预测准确性通常较低。 如图所示,一共有5个人,我们根据年龄和性别进行判断,这个人是否喜欢打篮球。我们首先根据年龄是否大于1...原创 2019-12-29 21:47:56 · 864 阅读 · 0 评论 -
R语言第十讲 逻辑斯蒂回归
模型函数介绍 Logistic Regression 虽然被称为回归,但其实际上是分类模型,并常用于二分类。Logistic Regression 因其简单、可并行化、可解释强深受工业界喜爱。 Logistic 回归的本质是:假设数据服从这个Logistic 分布,然后使用极大似然估计方法做参数的估计。 Logistic 分布是一种...原创 2019-12-26 19:34:18 · 5965 阅读 · 1 评论 -
R语言第九讲 验证集法
目的 为了更好的熟悉分析定性变量的逻辑斯谛回归分析的应用和验证集法(评估拟合拟合模型的一种方法),用一个简单的示例来介绍一下它们在分析数据中的应用。题目 在 Default 数据集上用income 和 balance 做逻辑斯谛回归来预测 default的概率。现在要用验证集方法来估计这个逻辑斯谛回归模型的测试错误率。在分析之前不要忘记设置一个随机种...原创 2019-12-24 19:36:00 · 3153 阅读 · 0 评论 -
R语言第八讲续 评估模型之自助法分析案例
题目 今天来用自助法评估一下ISLR 程序包中的 Portfolio (金融资产)数据集的预测函数相关资料 自助法(Bootstraping)是另一种模型验证(评估)的方法(之前已经介绍过单次验证和交叉验证)。其以自助采样(Bootstrap Sampling)为基础,即有放回的采样或重复采样。(注:这是一种样本内抽样的方法,即将样本看作总体并从中进行抽样。)...原创 2019-12-22 20:35:49 · 1626 阅读 · 1 评论 -
R语言第八讲 评估模型之交叉验证法分析案例
题目 评估Auto数据集上拟合多个线性模型所产生的测试错误率。Auto数据集是存在与ISLR程序包中的一个摩托车相关数据的数据集,读者可自行下载ISLR程序包,并将Auto数据集加载。相关资料 交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测...原创 2019-12-18 21:24:57 · 6181 阅读 · 2 评论 -
R语言第七讲 线性回归分析案例续
题目MASS 库中包含 Boston (波士顿房价)数据集,它记录了波士顿周围 506 个街区的 medv (房价中位数)。我们将设法用 13 个预测变量如 rm (每栋住宅的平均房间数), age (平均房 龄), lstat (社会经济地位低的家庭所占比例)等来预测 medv (房价中位数)。***********************************...原创 2019-12-17 21:01:38 · 3265 阅读 · 0 评论 -
R语言第七讲 线性回归分析案例
题目 MASS 库中包含 Boston (波士顿房价)数据集,它记录了波士顿周围 506 个街区的 medv (房价中位数)。我们将设法用 13 个预测变量如 rm (每栋住宅的平均房间数), age (平均房 龄), lstat (社会经济地位低的家庭所占比例)等来预测 medv (房价中位数)。*************************************...原创 2019-12-17 14:09:08 · 11443 阅读 · 2 评论