likexin0605-CSDN博客

转载 hive中大表join小表情况

一句原则：把重复关联键少的表放在join前面做关联可以提高join的效率和join相关的优化主要分为mapjoin可以解决的优化（即大表join小表）和mapjoin无法解决的优化（即大表join大表），前者相对容易解决，后者较难，比较麻烦。　　　　　　首先介绍大表join小表优化。以销售明细表为例来说明大表join小表的场景。　　　　　　假如供应商进行评级，比如（五星、四星、三星、二...

2019-02-15 18:55:33 11778 1

转载 SVM-支持向量机算法概述

转载于：http://blog.csdn.net/passball/article/details/7661887/（一）SVM的背景简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的，它在解决小样本、非线性及高维模式识别中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建

2017-03-09 20:47:37 286

转载排序算法的分析总结

转载于：blog.csdn.com/whuslei排序算法经过了很长时间的演变，产生了很多种不同的方法。对于初学者来说，对它们进行整理便于理解记忆显得很重要。每种算法都有它特定的使用场合，很难通用。因此，我们很有必要对所有常见的排序算法进行归纳。我不喜欢死记硬背，我更偏向于弄清来龙去脉，理解性地记忆。比如下面这张图，我们将围绕这张图来思考几个问题。

2015-07-14 16:53:14 524

转载 TF-IDF及其算法

转载于：http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html概念 TF-IDF（term frequency–inverse document frequency）是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件

2015-06-23 17:34:31 331

转载 eclipse运行hadoop程序的各种问题。主要对比命令行

转载于：http://blog.csdn.net/yuanyaxin/article/details/18229933搭建了一个Hadoop集群（一个master，三个slave），参照Hadoop实战上的wordcount代码，在eclipse运行，但是在web页面上查不到该job的id，后来发现是在单机上运行，那搭建这个集群还有什么意义，于是在网上查找答案，试着在eclipse中将ha

2015-06-16 23:19:11 589

转载 prim算法证明

转载自：http://blog.sina.com.cn/s/blog_70ec9a6f01012cxr.html1、算法概述用于生成连通无向图的最小代价生成树。2、算法步骤步骤一：树T初始状态为空；步骤二：从图中任意选取一个点加入T；步骤三：从图中找出能与T形成树的所有边，将代价最小的边加入T，形成新的树T；步骤四：检查T中边的条数；

2015-05-18 09:26:22 1400

转载关于全排列的递归和非递归算法

转载自：http://blog.csdn.net/e3399/article/details/7543861一）递归的全排列算法（A、B、C、D）的全排列为1、A后面跟（B、C、D）的全排列2、B后面跟（A、C、D）的全排列3、C后面跟（A、B、D）的全排列4、D后面跟（A、B、C）的全排列而对1中的（B、C、D）照样可以按照上面的形式进行分

2015-03-28 21:07:19 449

原创栈的应用表达式求值

# include# include#include//top在使用的时候自己利用取地址的方式//后缀表达式默认以'$'结束，需要自己添加/*说明此处运用两个栈，一个运算栈，一个符号栈，将中缀表达式转成后缀表达式时，需要去掉括号优先级说明：栈内比较(当前字符作为栈顶元素比较)：'(' 中缀表达时转成后缀表达式具体算法：从左向右依次扫描字符，如果是数字直接输出（注意，

2015-03-26 01:08:32 372

转载关于指针作为参数传递的一些探讨

值传递，指针传递？这几天在学习C过程中，在使用指针作为函数参数传递的时候出现了问题，根本不知道从何得解:源代码如下: createNode(BinNode *tree,char *p) { tree = (BinNode *) malloc(sizeof(BinNode)); tree->data = *p; }该代码

2015-03-26 00:18:47 1240

原创关于八方向的迷宫问题

问题描述：给定一个迷宫，入口为左上角，出口为右下角，问是否有路径从入口到出口，若有则输出一条这样的路径。注意移动可以从上、下、左、右、上左、上右、下左、下右八个方向进行。迷宫输入0表示可走，输入1表示墙。算法分析：此处的思想是，采用堆栈的巧用（或者说就是DFS深度优先搜索的方法）。# include# include# define Max_size 1

2015-03-23 17:55:58 2406 1

转载关于指针初始化的一些思考

转载自： http://www.cnblogs.com/uniqueliu/archive/2011/07/16/2108302.html我们在最开始定义一个指针的时候，最应该做的就是先将这个指针变量进行初始化，以防止它变成“野指针”。初始化的方式很简单，就是将0赋给这个指针变量：int *p=0;

2015-03-23 15:06:54 536

转载 KMP算法总结

KMP算法转载自网站： http://www.cnblogs.com/dolphin0520/archive/2011/08/24/2151846.html KMP算法在介绍KMP算法之前，先介绍一下BF算法。一.BF

2015-03-18 21:51:09 340

转载递归算法的时间复杂度终结篇

递归算法的时间复杂度终结篇　　开篇前言：为什么写这篇文章？笔者目前在学习各种各样的算法，在这个过程中，频繁地碰到到递归思想和分治思想，惊讶于这两种的思想的伟大与奇妙的同时，经常要面对的一个问题就是，对于一个给定的递归算法或者用分治思想缩小问题规模的算法，如何求解这个算法的时间复杂度呢？在google过很多的博文后，感觉这些博文总结的方法，有很好优秀的地方，但是都不够全面，有感于

2015-03-08 20:11:19 388

原创递归汉诺塔问题

算法：当只有一个盘子的时候，只需要从将A塔上的一个盘子移到C塔上。当A塔上有两个盘子是，先将A塔上的1号盘子（编号从上到下）移动到B塔上，再将A塔上的2号盘子移动的C塔上，最后将B塔上的小盘子移动到C塔上。当A塔上有3个盘子时，先将A塔上编号1至2的盘子（共2个）移动到B塔上（需借助C塔），然后将A塔上的3号最大的盘子移动到C塔，最后

2015-03-04 15:32:59 470

原创鸽笼原理之小序列问题

/*1．课题功能描述任意给定5个数字，其中必定存在3个数字已经有序（或者升序，或者降序），找出这5个数字中最长的升序或降序序列。例如：1，7，5，3，9。则{1，7，9}，{1，5，9}，{1，3，9}都是最长的升序序列；而{7，5，3}是最长的降序序列。再如：1，3，2，5，7。最长的升序序列为{1，3，5，7}和{1，2，5，7}。 2．问题的解决方案：自动生成各种可能的序列，对

2015-03-04 09:38:58 362

原创霍纳递归

# includeint Horner(int list[],int k,int x,int n){if(k==n-1)return list[k];elsereturn Horner(list,k+1,x,n)*x+list[k];}int main(){int a[7]={1,2,3,4,5,6,7};//A(x)=7x^6+6*x^5+5*x^4+4*

2015-03-03 12:48:09 399

u012671925的专栏