2016年07月_Bryan__

12月 09月 08月 07月 06月 05月 04月 03月

原创二叉查找树转双向链表JAVA实现

把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。10/ \6 14/ \ / \4 8 12 16转换成双向链表4=6=8=10=12=14=16。首先我们定义的二元查找树节点的数据结构如下：struct BSTreeNode{int m_nValu

2016-07-31 23:54:18 4681

原创 ubuntu14.04+hadoop2.6.2+hive1.1.1

1.Hive是基于Hadoop构建的一套数据仓库分析系统，它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据。其在Hadoop的架构体系中承担了一个SQL解析的过程，它提供了对外的入口来获取用户的指令然后对指令进行分析，解析出一个MapReduce程序组成可执行计划，并按照该计划生成对应的MapReduce任务提交给Hadoop集群处理，获取最终的结果。元数据——如表模式

2016-07-29 17:50:25 909

原创大杀器xgboost指南

之前做了一个视频，从基础的决策树到xgboost，再到代码实现，以及python接口，有兴趣的可以去看看https://class.pkbigdata.com/#/classDetail/forum/5本文不做深入探讨，仅供自己备忘原文：http://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboo...

2016-07-28 16:08:55 30464

原创机器学习算法比较

本文主要回顾下几个常用算法的适应场景及其优缺点！机器学习算法太多了，分类、回归、聚类、推荐、图像识别领域等等，要想找到一个合适算法真的不容易，所以在实际应用中，我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法，诸如SVM，GBDT，Adaboost，现在深度学习很火热，神经网络也是一个不错的选择。假如你在乎精度（accuracy）的话，最好的方法就是通过交叉验

2016-07-25 18:39:37 4984

原创数据倾斜

1数据倾斜的原因1.1操作：关键词情形后果Join其中一个表较小，但是key集中分发到某一个或几个Reduce上的数据远高于平均值大表与大表，但是分桶的判断字段0值或空值过多这些空值都由一个reduce处理，灰常慢group byg

2016-07-22 22:46:29 7360

原创 Java 8十个lambda表达式案例

1. 实现Runnable线程案例使用() -> {} 替代匿名类：//Before Java 8:new Thread(new Runnable() { @Override public void run() { System.out.println("Before Java8 "); }}).start();//Java 8 way:

2016-07-21 17:48:03 2169

原创 LCS最长公共子序列java版

这是一个动态规划问题当其中一个串长度为0的时候子序列为0当两个串尾字符相等时，最长子序列等于子串的最长子序列长度+1当尾字符不等时，等于两个串的子串最大的最长子序列长度上面是长度计算，计算具体子串的时候可以基于上面得到的矩阵来计算public static String LCS_caculate(String s1,String s2){ int size1=s1.

2016-07-17 00:32:54 5617 2

机器学习/数据挖掘岗面试准备

参加各大公司面试时准备的复习资料，已经拿到百度，腾讯，华为offer

2016-09-26

9个大数据竞赛方案分享，其中6次获得top10

对参加过的9个大数据竞赛一个浓缩的解决方案总结其中9个比赛6次获得top10

2016-06-15

数据挖掘比赛经验

之前应老师要求，跟学弟学妹们吹了下牛。只准备了一天，水平有限，看看就好

2016-05-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人