- 博客(30)
- 收藏
- 关注
原创 机器学习之手写实现决策树的核心代码(构建过程+逐句讲解)
假设一个样本中有N个属性,设a是其中的一个属性,这个属性,可以把这个样本分成多种情况,例如a1,a2,a3等等......(例如a是西瓜的色泽,a1=青绿,a2=乌黑,a3=浅白,之后通过得到这三种情况下正例,反例的个数,来计算这三种分类下的信息熵,并以此得到属性a的信息增益)我们知道,在构建决策树的过程中,最重要的步骤就是计算信息熵以及信息增益,从而决定最优的分支,在下面的代码中,将实现这一过程。所以,我们需要先计算按照属性a划分下每种情况的信息熵,再以此为基础计算信息增益。
2023-09-07 21:08:34 252
原创 python机器学习数据预处理之常用的数据可视化方法
既然要画图,首先需要生成一张画布,使用内置的subplot方法生成一张画布,其中,返回值有两个,分别是fig和axs。对象,代表整个图表,它是顶级容器。在这个图表中,你可以添加、修改或移除子图,调整图的大小和布局等。对象的二维数组(即具有行和列的网格布局),它代表了图表中的每一个子图。下面,我们在axs[0][0]这个区域用plot画一个图,并设置参数。在axs[0][1]区域用scatter画一个图,并设置参数。在区域axs[1][1]画一个饼图,同时设置图例。pie方法:绘制饼图。
2023-09-06 18:16:03 379
原创 python机器学习之数据预处理基础
本章通过实际案例,记录基础的数据预处理方法,以python的sklearn库的dataSets模块的案例为例进行测试和处理,同时对代码中的一些参数取值进行说明。
2023-08-24 15:24:47 150
原创 数据结构与算法:408考研算法经典题目大总结(不断更新)
1. 合并两个有序顺序表为一个有序顺序表。2. 删除有序顺序表中所有值重复的元素。3. 顺序表中删除给定值之间的元素。1. 删除线性表中所有值为x的元素。一. 线性表——顺序表部分。
2022-08-24 17:34:31 9842 8
原创 数据结构与算法:链式栈与链式队列的基本操作(带头节点与不带头节点对比分析)
代码】数据结构与算法:链式栈与链式队列的基本操作(带头节点与不带头节点对比分析)
2022-08-11 17:06:56 347
原创 数据结构与算法:链表的基本操作(包括带头节点,不带头节点的单链表以及双向链表)
数据结构与算法:链表的基本操作(包括带头节点,不带头节点的单链表以及双向链表)
2022-08-09 17:28:04 143
原创 数据结构与算法:二叉树层次遍历的应用(2)(求二叉树的最大最小值,宽度,深度,第k层节点数量,值为x的节点所在层次)
数据结构与算法:二叉树层次遍历的应用(2)
2022-07-18 17:05:02 1119
原创 数据结构与算法:折半查找二叉树与二叉排序树性能对比
引入一个例题来说明折半查找二叉树与平衡二叉树的区别:已知一个长度为16的顺序表,其元素按关键字有序排列,若采用折半查找算法查找一个不存在的元素,则比较的次数至少和至多的情况分别是:首先,需要知道如何构建一棵折半查找二叉树,因为折半查找要求元素需以有序的顺序表形式进行存储,假设这16个数就是1~16构成的有序序列,构造的折半查找二叉树如下:右图为将其所有的失败情况进行补充,我们发现,折半查找二叉树是一棵平衡的二叉排序树,要查找一个元素,其查找长度(即关键字对比次数)不会超过树的高度,而对于一棵
2022-05-22 11:34:02 2879
原创 数据结构与算法:基于图的DFS遍历分析递归工作栈工作原理
递归设计是栈的一个重要应用,递归是指把一个大型的复杂问题层层转化为一个与原问题相似的,且规模较小的问题来求解,递归策略只需要较少的代码量就可以描述出解题过程所需要的多次重复计算,如下的代码为图的DFS遍历算法实现的伪代码:void DFSTraverse(Graph G){ for(int i=0;i<G.vexnum;i++){ //初始化已访问标记数据 visited[i] = false; } for(int v=0;i<G.vexnum;v++){ if(!visit
2022-05-20 11:36:45 975
原创 数据结构与算法:栈的应用——表达式求值
一. 中缀表达式转前,后缀表达式(手算)1. 首先按照四则运算法则确定操作符的生效顺序,但是需要注意的是左优先原则,即在四则运算中左右操作符先对哪一个进行操作不影响其结果时,在转化后缀表达式时,先考虑左操作符2. 按照[左操作数 右操作数 运算符] 的形式组合成一个新的操作数3. 如果还有操作数没有处理,重复2,最终结果如下:同理,我们可以尝试将其转化为前缀表达式:一个易错案例:即转化后缀表达式时先考虑左操作符的问题:首先,根据左优先原则,先考虑A+B之间的“+”,而
2022-05-18 10:02:33 827
原创 数据结构与算法:图的最短路径问题(BFS,Dijkstra,Floyd)
数据结构与算法:图的最短路径问题(BFS,Dijkstra,Floyd)
2022-05-13 17:36:43 2738
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人