- 博客(7)
- 资源 (3)
- 收藏
- 关注
原创 二叉查找树转双向链表JAVA实现
把二元查找树转变成排序的双向链表题目:输入一棵二元查找树,将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点,只调整指针的指向。10/ \6 14/ \ / \4 8 12 16转换成双向链表4=6=8=10=12=14=16。首先我们定义的二元查找树节点的数据结构如下:struct BSTreeNode{int m_nValu
2016-07-31 23:54:18 4681
原创 ubuntu14.04+hadoop2.6.2+hive1.1.1
1.Hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据。其在Hadoop的架构体系中承担了一个SQL解析的过程,它提供了对外的入口来获取用户的指令然后对指令进行分析,解析出一个MapReduce程序组成可执行计划,并按照该计划生成对应的MapReduce任务提交给Hadoop集群处理,获取最终的结果。元数据——如表模式
2016-07-29 17:50:25 909
原创 大杀器xgboost指南
之前做了一个视频,从基础的决策树到xgboost,再到代码实现,以及python接口,有兴趣的可以去看看https://class.pkbigdata.com/#/classDetail/forum/5本文不做深入探讨,仅供自己备忘原文:http://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboo...
2016-07-28 16:08:55 30464
原创 机器学习算法比较
本文主要回顾下几个常用算法的适应场景及其优缺点!机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM,GBDT,Adaboost,现在深度学习很火热,神经网络也是一个不错的选择。假如你在乎精度(accuracy)的话,最好的方法就是通过交叉验
2016-07-25 18:39:37 4984
原创 数据倾斜
1数据倾斜的原因1.1操作:关键词情形后果Join其中一个表较小,但是key集中分发到某一个或几个Reduce上的数据远高于平均值大表与大表,但是分桶的判断字段0值或空值过多这些空值都由一个reduce处理,灰常慢group byg
2016-07-22 22:46:29 7360
原创 Java 8十个lambda表达式案例
1. 实现Runnable线程案例使用() -> {} 替代匿名类://Before Java 8:new Thread(new Runnable() { @Override public void run() { System.out.println("Before Java8 "); }}).start();//Java 8 way:
2016-07-21 17:48:03 2169
原创 LCS最长公共子序列java版
这是一个动态规划问题当其中一个串长度为0的时候子序列为0当两个串尾字符相等时,最长子序列等于子串的最长子序列长度+1当尾字符不等时,等于两个串的子串最大的最长子序列长度上面是长度计算,计算具体子串的时候可以基于上面得到的矩阵来计算public static String LCS_caculate(String s1,String s2){ int size1=s1.
2016-07-17 00:32:54 5617 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人