数据挖掘_啊～小 l i的博客-CSDN博客

数据挖掘

关注

文章平均质量分 84

关注数：文章数：5 文章阅读量：3925 文章收藏量：12

作者: 啊～小 l i

2020年获得“发现杯”大奖赛省级三等奖；2021年计算机设计大赛系统开发组省级优秀奖；“传智杯”Python组省级优秀奖；2022年蓝桥杯python组省级二等奖；计算机设计大赛人工智能组省级二等奖、国家级三等奖；

展开

决策树——示例加源码讲解

1 概述 1.1 决策树是如何工作的决策树（Decision Tree）是一种非参数的有监督学习方法，它能够从一系列有特征和标签的数据中总结出决策规则，并用树状图的结构来呈现这些规则，以解决分类和回归问题。决策树算法容易理解，适用各种数据，在解决各种问题时都有良好表现，尤其是以树模型为核心的各种集成算法，在各个行业和领域都有广泛的应用。我们来简单了解一下决策树是如何工作的。决策树算法的本质是一种图结构，我们只需要问一系列问题就可以对数据进行分类了。比如说，来看看下面这组数据集，这是一系列已知物种以

原创 2021-11-29 11:48:23 · 1324 阅读 · 1 评论
K-Means聚类[图像和数据](数据挖掘篇)

K-Means 是一种非监督学习，解决的是聚类问题。K 代表的是 K 类，Means 代表的是中心，你可以理解这个算法的本质是确定 K 类的中心点，当你找到了这些中心点，也就完成了聚类。那么请你和我思考以下三个问题：如何确定 K 类的中心点？如何将其他点划分到 K 类中？如何区分 K-Means 与 KNN？ K-Means 的工作原理对亚洲足球队的水平，你可能也有自己的判断。比如一流的亚洲球队有谁？你可能会说伊朗或韩国。二流的亚洲球队呢？你可能说是中国。三流的亚洲球队呢？你可能会说越南。其实这

原创 2021-10-24 12:02:43 · 1028 阅读 · 0 评论
数据分析45讲—支持向量机SVM(笔记)

什么是svm SVM 的英文叫 Support Vector Machine，中文名为支持向量机。它是常见的一种分类方法，在机器学习中，SVM 是有监督的学习模型。监督学习监督学习是指的是我们需要事先对数据打上分类标签，这样机器就知道这个数据属于哪个分类。同样无监督学习，就是数据没有被打上分类标签，这可能是因为我们不具备先验的知识，或者打标签的成本很高。所以我们需要机器代我们部分完成这个工作，比如将数据进行聚类，方便后续人工对每个类进行分析。SVM 作为有监督的学习模型，通常可以帮我们模式识别、分类以及

原创 2021-10-08 20:59:13 · 321 阅读 · 1 评论
数据分析45讲—决策树(笔记)

决策树原理：决策树基本上就是把我们以前的经验总结出来。打篮球的训练集如果我们要出门打篮球，一般会根据“天气”、“温度”、“湿度”、“刮风”这几个条件来判断，最后得到结果：去打篮球？还是不去？决策树构造构造就是生成一棵完整的决策树。简单来说，构造的过程就是选择什么属性作为节点的过程，那么在构造过程中，会存在三种节点：根节点：就是树的最顶端，最开始的那个节点。在上图中，“天气”就是一个根节点；内部节点：就是树中间的那些节点，比如说“温度”、“湿度”、“刮风”；叶节点：就是树最底部的节点，也就是

原创 2021-10-02 17:09:03 · 957 阅读 · 0 评论
数据分析45讲—数据挖掘基础(笔记)

数据挖掘数据挖掘的基本流程商业理解：数据挖掘不是目的，从商业角度理解项目的需求，在这个基础上在对数据挖掘的目标进行定义。数据理解：尝试收集部分数据，然后对数据进行探索，包括数据的描述、数据质量验证。数据准备：开始收集数据，并对数据进行清洗、数据集成等操作，完成数据挖掘前的准备操作。模型建立：选择和应用各种数据挖掘模型，并进行优化以便得到更好的分类结果。模型评估：对模型进行评价，并检查构建模型的每个步骤，确认模型是否有了预定的商业目标。上线发布：模型的作用是从数据中找到金矿，也就是我们所说的“

原创 2021-10-02 14:25:26 · 295 阅读 · 0 评论

数据挖掘

作者: 啊～小 l i

决策树——示例加源码讲解

K-Means聚类[图像和数据](数据挖掘篇)

数据分析45讲—支持向量机SVM(笔记)

数据分析45讲—决策树(笔记)

数据分析45讲—数据挖掘基础(笔记)