数据挖掘
文章平均质量分 84
啊~小 l i
2020年获得“发现杯”大奖赛省级三等奖;2021年计算机设计大赛系统开发组省级优秀奖;“传智杯”Python组省级优秀奖;2022年蓝桥杯python组省级二等奖;计算机设计大赛人工智能组省级二等奖、国家级三等奖;
展开
-
决策树——示例加源码讲解
1 概述 1.1 决策树是如何工作的 决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规 则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法容易理解,适用各种数据,在解决各 种问题时都有良好表现,尤其是以树模型为核心的各种集成算法,在各个行业和领域都有广泛的应用。 我们来简单了解一下决策树是如何工作的。决策树算法的本质是一种图结构,我们只需要问一系列问题就可以对数 据进行分类了。比如说,来看看下面这组数据集,这是一系列已知物种以原创 2021-11-29 11:48:23 · 1324 阅读 · 1 评论 -
K-Means聚类[图像和数据](数据挖掘篇)
K-Means 是一种非监督学习,解决的是聚类问题。K 代表的是 K 类,Means 代表的是中心,你可以理解这个算法的本质是确定 K 类的中心点,当你找到了这些中心点,也就完成了聚类。 那么请你和我思考以下三个问题: 如何确定 K 类的中心点? 如何将其他点划分到 K 类中? 如何区分 K-Means 与 KNN? K-Means 的工作原理对亚洲足球队的水平,你可能也有自己的判断。比如一流的亚洲球队有谁?你可能会说伊朗或韩国。二流的亚洲球队呢?你可能说是中国。三流的亚洲球队呢?你可能会说越南。其实这原创 2021-10-24 12:02:43 · 1028 阅读 · 0 评论 -
数据分析45讲—支持向量机SVM(笔记)
什么是svm SVM 的英文叫 Support Vector Machine,中文名为支持向量机。它是常见的一种分类方法,在机器学习中,SVM 是有监督的学习模型。 监督学习 监督学习是指的是我们需要事先对数据打上分类标签,这样机器就知道这个数据属于哪个分类。同样无监督学习,就是数据没有被打上分类标签,这可能是因为我们不具备先验的知识,或者打标签的成本很高。所以我们需要机器代我们部分完成这个工作,比如将数据进行聚类,方便后续人工对每个类进行分析。SVM 作为有监督的学习模型,通常可以帮我们模式识别、分类以及原创 2021-10-08 20:59:13 · 321 阅读 · 1 评论 -
数据分析45讲—决策树(笔记)
决策树 原理:决策树基本上就是把我们以前的经验总结出来。 打篮球的训练集如果我们要出门打篮球,一般会根据“天气”、“温度”、“湿度”、“刮风”这几个条件来判断,最后得到结果:去打篮球?还是不去? 决策树构造 构造就是生成一棵完整的决策树。简单来说,构造的过程就是选择什么属性作为节点的过程,那么在构造过程中,会存在三种节点: 根节点:就是树的最顶端,最开始的那个节点。在上图中,“天气”就是一个根节点; 内部节点:就是树中间的那些节点,比如说“温度”、“湿度”、“刮风”; 叶节点:就是树最底部的节点,也就是原创 2021-10-02 17:09:03 · 957 阅读 · 0 评论 -
数据分析45讲—数据挖掘基础(笔记)
数据挖掘 数据挖掘的基本流程 商业理解:数据挖掘不是目的,从商业角度理解项目的需求,在这个基础上在对数据挖掘的目标进行定义。 数据理解:尝试收集部分数据,然后对数据进行探索,包括数据的描述、数据质量验证。 数据准备:开始收集数据,并对数据进行清洗、数据集成等操作,完成数据挖掘前的准备操作。 模型建立:选择和应用各种数据挖掘模型,并进行优化以便得到更好的分类结果。 模型评估:对模型进行评价,并检查构建模型的每个步骤,确认模型是否有了预定的商业目标。 上线发布:模型的作用是从数据中找到金矿,也就是我们所说的“原创 2021-10-02 14:25:26 · 295 阅读 · 0 评论