数据结构
文章平均质量分 68
energy_百分百
while(1){慢几步,深几度}
展开
-
#浅谈# 构造哈夫曼树
哈夫曼树又称最优二叉树,哈夫曼树中离根节点越近,节点的权重越大统计每个数据出现的次数,将每个数据出现的次数组成数组构造哈夫曼树:选择数据列表中最小的两个值,相加成为一个新的节点,并将两个节点较小的值作为左节点,较大的值作为右节点; 将上一步选择的两个节点在数据列表中删除,将想加得到的新节点的值加入到数据列表中 重复执行1、2步操作,直至数据列表为空构造哈夫曼编码将构造的哈夫曼树所有节点的左分支赋值为0,右分支赋值为1,然后将根节点到每个叶子节点路径上的值连起来作为每个叶子节点对应的数据原创 2021-07-12 21:39:12 · 432 阅读 · 0 评论 -
#深入理解# AdaBoost 集成学习方法
在AdaBoost算法中每个样本会被赋予一个权重,然后依次训练多个分类器,每训练完一个分类器都会根据当前分类器的结果对每个样本被选中的概率进行更新并得到当前分类器的权重参数,如果某个样本被算错则增加此样本被选中的概率,反之则降低概率;最后根据更新后的样本权重重新选择N个样本去训练下一个分类器;预测时,将每个分类器的结果加权得到预测的结果AdaBoost算法训练过程:将正样本标签置为1,负样本标签置为-1 初始化样本被选中的概率(均匀分布,每个样本被选中的概率为1/n) 根据样本权重选取N个样本训原创 2021-07-12 17:00:25 · 345 阅读 · 0 评论 -
#深入理解# 决策树综述(ID3、C4.5、CART)
目录1. 构造决策树的依据1.1 信息增益度1.2信息增益率1.3基尼系数2. ID3 vs C4.5 vs CART3. 剪枝操作3.1 预剪枝3.2 后剪枝4. 关于 ID3、C4.5、CART 的几个问题1. 构造决策树的依据决策树的构造,从本质上讲就是每次将样本分成几组,目标是让每一组中的类别尽可能单一(每组的熵加权相加后的值尽可能的小)ID3中使用最大化信息增益度对样本进行分组,C4.5中使用最大化信息增益率对样本进行分组,CART中使用最小化分..原创 2021-07-11 20:02:38 · 600 阅读 · 0 评论 -
全面理解哈希函数及其应用
1. 哈希函数哈希函数是指一种能够讲任意数据转换为固定长度编码的一种函数,因为不同数据得到的哈希值可能相同,因此哈希过程一般是不可逆的,哈希函数可以应用的密码加密,哈希存储等方面。好的哈西函数应该具备以下特点:相同的数据得到的哈希值唯一通过哈希值无法通过反向推导得到源数据源数据发生微小改变,得到的哈希值完全不同,长的字符也能快速的计算出哈希值要尽量避免冲突(不同的数据得到的编码要尽量不同)2. 哈希加密算法比如对用户密码的加密,如果使用明文来存储用户密码,那么管理员很容易就能在后台获取原创 2021-06-09 22:40:18 · 7981 阅读 · 0 评论