数据结构
文章平均质量分 66
hello-elena
这个作者很懒,什么都没留下…
展开
-
数据挖掘算法
ClusteringWhatis clustering?一个没有类别信息的数据集,完全依靠数据点间的相似性聚集为几个类内相似性较大,类间相似性较小的类。 Whatare the two categories of clustering methods?划分方法:k-MEANS DBSCAN基于层次:Agglomerative Methodsv Partitioning原创 2016-06-26 14:19:38 · 2185 阅读 · 0 评论 -
复杂链表的复制
题目描述输入一个复杂链表(每个节点中有节点值,以及两个指针,一个指向下一个节点,另一个特殊指针指向任意一个节点),返回结果为复制后复杂链表的head。(注意,输出结果中请不要返回参数中的节点引用,否则判题程序会直接返回空)/*struct RandomListNode { int label; struct RandomListNode *next, *rando原创 2017-04-30 17:46:16 · 263 阅读 · 0 评论 -
二叉树
考虑到面试,便将一些知识整理一下,温故而知新。二叉树,链表,图,贪心,动规,数组,哈希表……先看看二叉树吧。摘自剑指offer。1.(第六题)重建二叉树BinaryTreeNode原创 2017-04-06 16:37:36 · 869 阅读 · 0 评论 -
八大排序算法小结
转自:blog.csdn.com/whuslei我不喜欢死记硬背,我更偏向于弄清来龙去脉,理解性地记忆。比如下面这张图,我们将围绕这张图来思考几个问题。 上面的这张图来自一个PPT。它概括了数据结构中的所有常见的排序算法。现在有以下几个问题: 1、每个算法的思想是什么? 2、每个算法的稳定性怎样?时间复杂度是多少?转载 2017-04-05 09:45:09 · 344 阅读 · 0 评论 -
C++基础知识
1.内联函数 内联函数提供中子啊编译时可将调用函数直接嵌入主题的一种方法,这种嵌入到主调函数中的函数被称为内联函数 inline double square(double x){return x*x}void main (){ double x; cout cin>>x; cout}内联函数和普通函数的主要区别:1.内联函数有inlin原创 2017-04-21 22:57:35 · 219 阅读 · 0 评论 -
剑指offer--堆、栈,队列、链表题目总结
标准库的栈和队列时,先包含相关的头文件#includestack stk;栈提供了如下的操作s.empty() 如果栈为空返回true,否则返回false s.size() 返回栈中元素的个数 s.pop() 删除栈顶元素但不返回其值 s.top()原创 2017-04-21 22:18:49 · 344 阅读 · 0 评论 -
剑指offer数学题
1.斐波那契数列F(0)=1;F(1)=1;F(n)=F(n-1)+F(n-2);青蛙跳题目,兔子生兔子题目。递归的方法long long Fibonacci(unsigned int n){int (nreturn 0; int (n==1)}原创 2017-04-21 22:56:06 · 297 阅读 · 0 评论 -
宽度优先搜索与深度优先搜索
宽度优先搜索算法顺序:1-2-3-4-5-6-7深度优先搜索算法顺序:1-2-4-5-3-6-7宽度优先搜索算法(又称广度优先搜索)BFS,属于一种盲目搜寻法,目的是系统地展开并检查图中的所有节点,以找寻结果。换句话说,它并不考虑结果的可能位置,彻底地搜索整张图,直到找到结果为止。Dijkstra单源最短路径算法和Prim最小生成树算法都采用了和宽度优先搜索类似的思想。stru原创 2017-04-26 16:14:01 · 6167 阅读 · 0 评论 -
【十大经典数据挖掘算法】系列
转自http://www.cnblogs.com/en-heng/p/5013995.html【十大经典数据挖掘算法】系列C4.5K-MeansSVMAprioriEMPageRankAdaBoostkNNNaïve BayesCART1. 决策树模型与学习决策树(decision tree)算法基于特征属性进行分类,其主转载 2017-03-14 19:42:15 · 674 阅读 · 0 评论 -
数据处理
1. 怎样处理丢失数据 忽略手动填补丢失值自动填补丢失值2.如何检验异常值概率分布采用统计检验 距离度量原理任何簇的点,密度局部利群点因子3.处理不平衡数据集的主要任务一准确度度为评价指标的分类方法不能很好的处理不平衡数据集4.为什么特征选择如此器重要数据包含有很多冗余的,不相关的特征。特征选择可以提高模型的可解释性,导致更短的训练时间,能够避免过拟合现象从而原创 2016-06-26 14:20:15 · 272 阅读 · 0 评论 -
大数据资料整理
1.大数据概念Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。2.数据库和数据仓库设计:数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来原创 2016-06-21 16:47:58 · 2492 阅读 · 0 评论 -
算法部分整理
1.PCA主成分分析主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。无监督的学习,往特征量最大的特征向量的分销商投影PCA的主要问题没有考虑类别号进行主成分分析主要步骤如下:1. 指标数据标准化(SPSS软件自动执行)原创 2016-06-21 17:24:28 · 327 阅读 · 0 评论 -
聚类算法
1.k-meansk-means 算法接受参数 k ;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类原创 2016-06-22 21:47:30 · 730 阅读 · 0 评论 -
分类算法
Classification I: KNN , Naive Bayes算法步骤:step.1---初始化距离为最大值step.2---计算未知样本和每个训练样本的距离diststep.3---得到目前K个最临近样本中的最大距离maxdiststep.4---如果dist小于maxdist,则将该训练样本作为K-最近邻样本step.5---重复步骤原创 2016-06-23 00:10:53 · 998 阅读 · 0 评论 -
数据结构之排序算法
#include #include#include#include#includeusing namespace std;void print(int a[], int n, int i) { cout << i << ":"; for (int j = 0; j<8; j++) { cout << a[j] << " "; } cout << endl;}vo原创 2016-09-19 15:20:03 · 552 阅读 · 0 评论 -
OpenMP和Pthread比较
pthread在程序启动时创建一束线程,将工作分配到线程上。然而,这种方法需要相当多的线程指定代码,而且不能保证能够随着可用处理器的数量而合理地进行扩充。 OpenMP,不需要指定数量,在有循环的地方加上代码,修改设置文件极客。OpenMP 非常方便,因为它不会将软件锁定在事先设定的线程数量中,但是相对的查错更难也更麻烦。原创 2016-09-19 16:50:02 · 2296 阅读 · 0 评论 -
B树、B-树、B+树、B*树的区别
转自:http://blog.csdn.net/dhuwxs/article/details/20797593 http://www.tuicool.com/articles/qqYF7zB 树即二叉搜索树:1. 所有非叶子结点至多拥有两个儿子( Left 和 Right );2. 所有结点存储一个关键字;3. 非转载 2017-04-26 16:31:14 · 251 阅读 · 0 评论