![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
西瓜书
文章平均质量分 80
x@临霖
这个作者很懒,什么都没留下…
展开
-
西瓜书第四章(决策树)
决策树是什么东西?就是我们平常所说的if-else语句嵌套,我们把它组合成树的结构. 决策树中有两种结点,叶子结点和非叶子结点. 其中非叶节点代表的条件,叶子结点表示的实例所属的类别.我们如何生成这个决策树呢,最主要的一点就是选择那个特征作为当前树的分割结点,这就叫做特征选择,有了特征选择就有了决策树的生成,最后我们还有进行决策树剪枝(后面会提到为什么剪枝).现在我们有下面一张表的数据,想生成一个决策树模型,预测某个人是否符合贷款条件.现在假如我们通过"某种方法"构造了一颗下面的决策树. 从下图可以原创 2021-08-26 16:52:14 · 98 阅读 · 0 评论 -
西瓜书第三章线性模型(线性回归和对数几率回归)
1.线性回归问题定义:给定数据集D=(x1,y1),x2,y2,......,(xm,ym)D={(x_1,y_1),x_2,y_2,......,(x_m,y_m)}D=(x1,y1),x2,y2,......,(xm,ym),其中,xi=(xi1;xi2;......;xid,yi∈ℜx_i = (x_{i_1};x_{i_2};......;x_{i_d},y_i \in \Rexi=(xi1;xi2;......;xid,yi∈ℜ.“线性回归”(linear model原创 2021-08-23 23:28:41 · 252 阅读 · 0 评论 -
西瓜书第一、二章笔记
以监督学习来介绍一下机器学习的一些基本概念。数据集训练集:有正确标签,用来学习,归纳的数据集。测试集 :没有正确标签,用来测试模型的优劣的数据集。过拟合和欠拟合过拟合:当学习器将训练样本学得太好了的时候,很可能已经把训练样本自身的一些特点当作了所以潜在样本都会具有的一般性质,这样就会导致泛化性能下降。欠拟合:训练样本的一般性质尚未学好。评估方法通常,我们可通过实验测试来对学习器的泛化误差进行评估并进而做出选择,为此,需使用一个“测试集”(testing set)来测试学习器对新样本的原创 2021-08-16 20:48:41 · 85 阅读 · 0 评论