机器学习
文章平均质量分 61
qq_41627642
这个作者很懒,什么都没留下…
展开
-
机器学习之分类回归模型(决策数、随机森林)
每个决策树都有很高的方差,但是当我们将它们并行地组合在一起时,结果的方差就会很低,因为每个决策树都在特定的样本数据上得到了完美的训练,因此输出不依赖于一个决策树,而是依赖于多个决策树。step 4: Random Forest Regressor model代码对分类数据进行数字编码处理,将处理后的数据与数字数据结合起来,使用准备好的数据训练Random Forest Regression模型。先补充组合分类器的概念,将多个分类器的结果进行多票表决或取平均值,以此作为最终的结果。原创 2024-03-11 15:23:52 · 806 阅读 · 0 评论 -
机器学习之非监督学习(KMeans)
聚类算法之K-means算法K-means算法优化(二分K-means算法)原创 2021-02-15 11:57:27 · 110 阅读 · 0 评论 -
机器学习模型评估与超参数调优详解(机器学习集成学习与模型融合!)
机器学习模型评估与超参数调优详解原创 2020-08-30 18:04:42 · 299 阅读 · 0 评论 -
随机森林
库的知识补充1、pd.isna(大部分数据处理的场合推荐使用)判断DateFrame格式的数据是否出现空值,如果我们的空值既会出现np.nan,也会出现math.nan,甚至还会出现None,或者要判断的数据值既可能是数值型也可能是字符串(符合大部分场景的实际情况),墙裂推荐使用pd.isna,例如下面代码:pd.isna(np.nan)Out[29]: Truepd.isna(math.nan)Out[30]: Truepd.isna(None)Out[31]: Truepd.isna(原创 2020-06-08 00:11:36 · 185 阅读 · 0 评论 -
CS231N课程学习笔记
课程1(CS231N)1、目标识别进展:1、根据物体的边缘和曲线进行识别2、传统机器学习进行分类和识别3、SIFT特征匹配整个目标。(结论:某些特征能够在变化中具有表现性和不变性)4、深度学习(卷积神经网络)传统机器学习存在的问题:可视化的数据非常复杂,由于数据复杂,所以模型的维度高,同时还存在许多需要调优的参数。当训练数据不够时,很快会产生过拟合。2、图像分割:把一张图中的像素点归类到有意义的区域。3、数据集:PASCAL VOC 20个类别IMAGE NET 2200个类别..原创 2020-06-03 14:30:20 · 133 阅读 · 0 评论