数据与算法
文章平均质量分 67
涛涛之海
学好编程,成为一名高级工程师
展开
-
排序二叉树(概念性)了解一下
文章目录基本概念基本算法1.查找2.遍历3.插入4.删除平衡的排序二叉树参考文章基本概念树的基本概念,在计算机程序中,树是从上往下长的,也会有分叉,有个根节点,每个节点可以有一个或多个节点,没有孩子节点的节点一般称为叶子节点。二叉树是一棵树,每个节点最多有两个孩子节点,一左一右,左边的称为左孩子,右边的称为右孩子。排序二叉树,也是二叉树,它没有重复元素,而且是有序的二叉树,对每个节点如果...原创 2020-03-21 22:07:53 · 1164 阅读 · 1 评论 -
剑指offer之跳台阶的思路
题目描述一只青蛙一次可以跳上1级台阶,也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法。思路 举个例子:跳6个台阶,我们怎么跳? (1)我们倒着想6个台阶可以由从第4个台阶或者第5个台阶跳 (2)第5个台阶可以由第4个台阶或者是第3个台阶跳 (3)第4个台阶可以由第3个台阶或者第2台阶 所以,我们得到一个规律: 当台阶数大于等于3时: third = two ...原创 2018-06-17 20:40:23 · 158 阅读 · 0 评论 -
插入排序之理解
插入排序的思路1. 数组中第i个元素起拿出,备份(i>=1) 2.依次和第i个元素之前的元素进行比较 3.当出现比第i个元素大的元素时 4.把较大元素往后挪一个位置 5.把第i个元素往前挪一个位置//思路把数组后未排序好的元素放到数组前排序好的元素中public class insertSort { public static void main(Str...原创 2018-06-07 10:27:28 · 156 阅读 · 0 评论 -
FP-growth算法
FP-growth算法简介及特点FP-growth算法的基本思路FP树构造实例FP-growth算法简介及特点这个算法只进行2次数据库扫描。 它不使用侯选集,直接压缩数据库成一个频繁模式树,最后通过这棵树生成关联规则。 算法的最大特点是不需要产生候选项集,大大提高了挖掘效率。 FP-growth算法的基本思路FP树构造为了方便遍历FP...原创 2018-05-07 19:27:18 · 336 阅读 · 0 评论 -
Apriori算法
Apriori算法介绍Apriori算法步骤由频繁项集产生关联规则Apriori算法介绍Apriori算法是挖掘布尔关联规则频繁项集的算法,它采用逐层搜索策略(层次搜索策略)产生所有的频繁项集。Apriori算法利用的是Apriori性质:频繁项集的所有非空子集也必须是频繁的。 模式不可能比A更频繁的出现 Apriori算法是反单调...原创 2018-05-01 10:35:19 · 2481 阅读 · 0 评论 -
大型数据库中的关联规则挖掘
什么是关联规则挖掘?关联规则:基本概念基本概念——示例k-项集 基本概念关联规则挖掘分类什么是关联规则挖掘?关联规则挖掘: 从事务数据库,关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。应用: 购物篮分析、分类设计、捆绑销售等关联规则:基本概念给定: 项的集合:I={i1,i2,…,in} 任务相关数据D...原创 2018-05-01 09:34:05 · 1694 阅读 · 0 评论 -
数据预处理
为什么要预处理数据?数据质量的多维度量数据预处理的主要任务空缺值如何处理空缺值噪声数据如何处理噪声数据数据集成处理数据集成中的冗余数据数据变换数据归约策略为什么要预处理数据?现实世界的数据是“肮脏的”——数据多了,什么问题都会出现不完整的:有些感兴趣的属性缺少属性值,或仅包含聚集数据含噪声的:包含错误或者“孤立点”不一致的:在编码或者命名上存...原创 2018-05-01 08:42:57 · 1243 阅读 · 0 评论 -
数据仓库和OLAP技术
什么是数据仓库数据仓库的构建与使用数据仓库与操作数据库系统数据仓库的概念模型一种数据挖掘查询语言: DMQL概念分层多维数据模型上的OLAP操作什么是数据仓库数据仓库的定义很多,但却很难有一种严格的定义它是一个提供决策支持功能的数据库,它与公司的操作数据库分开维护。为统一的历史数据分析提供坚实的平台,对信息处理提供支持数据仓库关键特征 面向主题...原创 2018-04-30 23:17:04 · 3965 阅读 · 0 评论 -
数据挖掘概述
什么是数据挖掘并非所有东西是数据挖掘基于数据仓库的OLAP系统机器学习系统,数据统计分析系统信息系统数据挖掘的步骤在何种数据上进行数据挖掘关系数据库数据仓库事务数据库高级数据库系统和信息库空间数据库时间数据库和时间序列数据库流数据多媒体数据库面向对象数据库和对象-关系数据库异构数据库和历史(legacy)数据库文本数据库和万维网(WWW)数...原创 2018-04-30 22:23:56 · 472 阅读 · 0 评论 -
决策树之ID3算法实现(python)
决策树的概念其实不难理解,下面一张图是某女生相亲时用到的决策树:基本上可以理解为:一堆数据,附带若干属性,每一条记录最后都有一个分类(见或者不见),然后根据每种属性可以进行划分(比如年龄是>30还是<=30),这样构造出来的一棵树就是我们所谓的决策树了,决策的规则都在节点上,通俗易懂,分类效果好。那为什么跟节点要用年龄,而不是长相?这里我们在实现决策树的时候采用的是ID3算法,...转载 2018-04-19 11:15:02 · 619 阅读 · 0 评论 -
栈(Stack)和队列(Queue)区别
栈(Stack)和队列(Queue)是两种操作受限的线性表。(线性表:线性表是一种线性结构,它是一个含有n≥0个结点的有限序列,同一个线性表中的数据元素数据类型相同并且满足“一对一”的逻辑关系。“一对一”的逻辑关系指的是对于其中的结点,有且仅有一个开始结点没有前驱但有一个后继结点,有且仅有一个终端结点没有后继但有一个前驱结点,其它的结点都有且仅有一个前驱和一个后继结点。)这种受限表现在:...转载 2018-04-07 09:00:30 · 15638 阅读 · 0 评论 -
聚类分析经典算法讲解及实现
聚类分析经典算法讲解及实现 ...转载 2018-04-10 09:37:34 · 602 阅读 · 0 评论 -
决策树算法
目录索引目录索引1.背景知识2.构造决策树3.一些需要了解的数学概念3.1 信息熵3.2随机变量3.3数学期望4.决策树构建的一般流程5. 数据的构建6.计算给定数据的信息熵7.划分数据集7.1 基本概念7.2 具体操作8.计算信息增益9.特殊情况的处理10.递归构建决策树11.创建决策树代码写在后面的话...转载 2018-04-02 22:33:30 · 166 阅读 · 0 评论 -
朴素贝叶斯算法
带你搞懂朴素贝叶斯分类算法带你搞懂朴素贝叶斯分类算贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。这篇文章我尽可能用直白的话语总结一下我们学习会上讲到的朴素贝叶斯分类算法,希望有利于他人理解。1 分类问题综述 对于分类问题,其实谁都不会陌生...转载 2018-04-09 21:02:21 · 250 阅读 · 0 评论 -
决策树之ID3算法
1. 决策树的基本认识 决策树是一种依托决策而建立起来的一种树。在机器学习中,决策树是一种预测模型,代表的是一种对象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。 决策树仅有单一输出,如果有多个输出,可以分别建立...转载 2018-04-09 20:52:35 · 411 阅读 · 0 评论 -
关联规则挖掘——Apriori算法的基本原理以及改进
问题引入关联规则挖掘发现大量数据中项集之间有趣的关联或者相互联系。关联规则挖掘的一个典型例子就是购物篮分析,该过程通过发现顾客放入其购物篮中不同商品之间的联系,分析出顾客的购买习惯,通过了解哪些商品频繁地被顾客同时买入,能够帮助零售商制定合理的营销策略。购物篮事务的例子如下图所示: 例如:在同一次去超级市场时,如果顾客购买牛奶,同时他也...转载 2018-04-09 19:57:42 · 2844 阅读 · 0 评论 -
冒泡,快速,选择排序之理解
冒泡算法 思路: 在要排序的一组数中,对当前还未排好序的范围内的全部数,自上而下对相邻的两个数依次进行比较和调整,让较大的数往下沉,较小的往上冒。 即:每当两相邻的数比较后发现它们的排序与排序要求相反时,就将它们互换/*最简单的冒泡算法 * N个数,比较(N-1)次,而随着比较的次数的增加,每次要进行比较的数据依次减少。 * 每趟比较下来都会确定一个数的位置 *...原创 2018-03-24 14:59:41 · 297 阅读 · 0 评论 -
数据结构之排序算法
文档版本 开发工具 测试平台 工程名字 日期 作者 备注 V1.0 2016.04.06 lutianfei none V1.1 2016.07.16 lutianfei 增加了归...转载 2018-03-23 10:58:34 · 186 阅读 · 0 评论