IK Analyzer 和 lucene结合使用

特别注意:版本问题(IK Analyzer的版本中注意各个版本的细微区别,小编就是栽在IK Analyzer2012_U5 和IK Analyzer2012FF上了) 版本匹配: 1、IK Analyzer 2012_U5 支持的是 lucene 3.2-3.6版本 2、IK Analyzer2012 FF(你问啥是FF,其实就是For 4.0,在API和功能上保持不变,只是让其支持了L...
阅读(1832) 评论(1)

《图论》——深度优先搜索算法(DFS)

深度优先搜索遍历类似于树的先序遍历。假定给定图G的初态是所有顶点均未被访问过,在G中任选一个顶点i作为遍历的初始点,则深度优先搜索递归调用包含以下操作: (1)访问搜索到的未被访问的邻接点; (2)将此顶点的visited数组元素值置1; (3)搜索该顶点的未被访问的邻接点,若该邻接点存在,则从此邻接点开始进行同样的访问和搜索。 深度优先搜索DFS可描述为: (1)访问v0顶点;...
阅读(1185) 评论(0)

四、伪分布下安装hive1.2

声明:本篇blog并没有配置MySQL,不过会在接下来的文章中实现 一、环境 Ubuntu14.04 hadoop2.6伪分布(安装教程请参考:点击打开链接) hive-1.2.1(下载链接:点击打开链接) 二、安装 1、将其下载的安装包解压到相应的目录,在此小编的是/usr/local/hadoop/      tar  -zxcf apache-hive-1.2.1-bin....
阅读(2932) 评论(3)

《图论》——广度优先遍历算法(BFS)

十大算法之广度优先遍历: 本文以实例形式讲述了基于Java的图的广度优先遍历算法实现方法,具体方法如下: 用邻接矩阵存储图方法: 1.确定图的顶点个数和边的个数 2.输入顶点信息存储在一维数组vet中 3.初始化邻接矩阵; 4.依次输入每条边存储在邻接矩阵array中 输入边依附的两个顶点的序号i,j; 将邻接矩阵的第i行第j列的元素值置为1; 将邻接矩阵的第...
阅读(1878) 评论(0)

《排序算法》——堆排序(大顶堆,小顶堆,Java)

堆的定义如下:   n个元素的序列{k0,k1,...,ki,…,k(n-1)}当且仅当满足下关系时,称之为堆。   " ki=k2i,ki>=k2i+1.(i=1,2,…,[n/2])"   若将和此次序列对应的一维数组(即以一维数组作此序列的存储结构)看成是一个完全二叉树,   则完全二叉树中每一个节点的值的都大于或等于任意一个字节的值(如果有的话),称之为大顶堆。   则完全二叉树...
阅读(2032) 评论(0)

hbase shell 基本操作命令

hbase shell 的基本命令操作大全...
阅读(1210) 评论(0)

三、伪分布环境下安装hbase

环境说明:     1、hadoop2.6伪分布安装:具体请参考博主的一篇文章:http://blog.csdn.net/gamer_gyt/article/details/46793731     2、Ubuntu14.04     3、hbase-0.98.13-hadoop2-bin,hbase下载链接:http://apache.mirrors.tds.net/hbase/...
阅读(1367) 评论(0)

线性查找算法

十大算法之线性查找: 介绍: BFPRT算法解决的问题十分经典,即从某n个元素的序列中选出第k大(第k小)的元素,通过巧妙的分 析,BFPRT可以保证在最坏情况下仍为线性时间复杂度。该算法的思想与快速排序思想相似,当然,为使得算法在最坏情况下,依然能达到o(n)的时间复杂 度,五位算法作者做了精妙的处理。 时间复杂度 O(N) 算法步骤: 1. 将...
阅读(2215) 评论(0)

二分查找算法

十大算法之二分查找...
阅读(1529) 评论(2)

《排序算法》——快速排序(Java)

十大算法是快速排序,其实很简单...
阅读(986) 评论(0)

搜索引擎:MapReduce实战----倒排索引

倒排索引(Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。...
阅读(1614) 评论(0)

MapReducer中的多次归约处理

为什么需要在Mapper端进行归约处理? 为什么可以在Mapper端进行归约处理? 既然在Mapper端可以进行归约处理,为什么在Reducer端还要处理?...
阅读(1393) 评论(0)

hadoop命令——hdfs

hadoop hdfs常用命令...
阅读(1123) 评论(0)

VirtualBox 虚拟Ubuntu系统与主机互ping

VBox安装的UBuntu虚拟系统与主机windows8之间互ping...
阅读(2068) 评论(0)

linux ifconfig命令配置ip地址

Linux(Ubuntu)关于ifconfig的若干解释...
阅读(1614) 评论(0)

二、hadoop伪分布搭建

Ubuntu14.04安装hadoop2.6伪分布环境...
阅读(2359) 评论(1)

MySQLdb的安装与使用

Python安装MySQLdb与使用教程...
阅读(1657) 评论(0)
    Thinkgamer微博
    个人微信,一起交流!

     扫一扫,关注我




    个人资料
    • 访问:751721次
    • 积分:9426
    • 等级:
    • 排名:第1985名
    • 原创:212篇
    • 转载:22篇
    • 译文:2篇
    • 评论:273条
    个人简介
    姓名:Thinkgamer

    Github:https://github.com/thinkgamer

    主攻:云计算/python/数据分析

    程度:熟悉/熟悉/熟悉

    微信:gyt13342445911

    Email:thinkgamer@163.com

    工作状态:在职ing

    心灵鸡汤:只要努力,你就是下一个大牛...

    hadoop/spark/机器学习群:279807394(大神建的群,蹭个管理员)

    欢迎骚扰........
    博客专栏
    最新评论