2015年07月_mychaint

原创【总览】我的技术博客

我的博客共有六个栏目：（一）数字逻辑与计算机原理 -- 计算机原理性知识总结（二）JAVA和J2EE-- JAVA语言细节和企业级框架应用实践，spring, hibernate等。（三）数据结构 -- 数据结构分析和原码剖析（四）基础算法 -- 算法介绍和实现（五）编程习题 -- 各类型编程习题，技术面试题等（六）机器学习 -- 线性回归，逻辑回归，聚类算法，SVM，统计学习等理论和实践

2015-07-07 22:19:50 301

原创【源代码】java.util.Stack & Queue

这里给出java.util.Stack和java.util.Queue的源代码。代码来源http://developer.classpath.org/

2015-07-24 16:34:32 497

原创【源代码】java.util.Vector

这里列出java.util.Vector容器的源代码。

2015-07-24 16:12:51 551

原创【算法】聊聊排序

程序开发过程中常常遇到对于一堆无序的数据进行排序的需求。对于不同的数据类型和存储位置，产生了不同的排序算法。掌握它们并应用在实际开发中是每一个程序员都需要具备的能力。这篇文章将聊聊一些基本排序算法和它们的一些应用。如下是本文内容目录：一、最简单的排序算法，时间复杂度O(n^2)1. 选择排序2. 插入排序3. 冒泡排序二、更快的排序算法们，时间复杂度O(nlogn)

2015-07-14 22:25:17 732

原创【中文分词】亲手开发一款中文分词器——原理

前文已经谈到几种分词方法的手段和困难，本文将从最基本原理开始，一步一步分析我自己的分词器是如何开发的。从最初出发点开始，我们需要确定那些字的组合是词语。每两个字能否组合成词语，其实取决于两个字同时以相同顺序出现在文章中的次数有关，次数越高，代表他们越有可能组合成词。假设一个字A出现在一篇文章中的概率为P(A)，另一个字B出现在文中的概率为P(B)，那么AB同时出现在文章中的概率为P(A

2015-07-10 13:38:46 3034 2

原创【编程习题★★★☆☆】寻找数组中元素间最大差值

题目：编程寻找数组中差值最大的两个数，以位置在后的数减位置在前的数为差，要求线性时间完成。

2015-07-09 11:50:59 523

原创【编程习题★★★☆☆】计算岛屿的数量

题目：用一个N*N的矩阵来表示一张地图，其中0位海洋，1位陆地。被0保围起来的所有1组成岛屿。试计算矩阵中岛屿的数量。

2015-07-09 11:43:07 2314

原创【编程习题★★☆☆☆】螺旋打印N*N的矩阵

题目：螺旋打印一个N*N的矩阵

2015-07-09 11:30:12 1341

原创【中文分词】亲手开发一款中文分词器——源代码

这里提供我开发的中文分词器源代码。代码分为三个部分：（一）状态矩阵元素对象GNode。动态规划中，状态矩阵的元素需要记录当前最大概率和前一个最优匹配状态，这个矩阵是一个二维数组，每一个元素就是一个GNode对象。（二）统计学习使用的嵌套哈希表THash。用于统计学习时记录结果的HashMap，这个哈希表有三层嵌套，对于收入数据有一些必要操作，为了简单起见，我将这个哈希表进行了封装

2015-07-09 10:01:23 2455

翻译隐马尔科夫模型详解（一）

原文《A Revealing Introduction to Hidden Markov Models》首先声明，introduction原本介绍之意，前边又加一个revealing修饰，很难想到一个对应的中文词语来解释它，所以就姑且参照《Introduction to Algorithms》的翻译，叫做导论。本文作者：Mark Stamp, 圣荷西州立大学计算机学院副教授。

2015-07-08 17:44:59 832

原创【英文分词】Stemming Segmentation，基于词干分词

英文分词主要是将各种时态形式的单词映射会同一种形式便于计算机理解。本文将列举一种基于词干分词的算法，这种算法建立在对英文构词法的充分了解上，所以代码中对各种形式的词汇的构词进行了拆解。英文分词的目标是将不同形式映射到同一形式，而不是原始形式。

2015-07-08 16:48:25 1578

原创【中文分词】亲手开发一款中文分词器--前言

所谓分词，就是将一个完整的句子按正确的意思将每一个词语提取出来的操作。分词是自然语言处理的第一个关卡，是让计算机处理人类语言的基础。但是计算机是无法识别人类语言中词汇这一概念的，更何况如何去识别理解词语了。所以如何通过有效的手段来进行分词是一个重要节点性问题。

2015-07-08 15:47:35 973

原创【编程习题★★☆☆☆】指数结果取后三位

问题：求整数3的33次方的后三位。

2015-07-08 11:41:16 679

原创【源代码】java.util.ArrayList

与LinkedList类似，ArrayList是另一个线性表容器。不过其内部基于数组的扩容实现。本文罗列其源代码并分析其原理。

2015-07-08 11:01:54 1185

原创【源代码】java.util.LinkedList

java.util是一个极为重要的容器类库，里边提供了诸多经典的数据结构的实现，可以应对工业开发中大多数常见需求。本文将针对java.util.LinkedList的源代码进行分析，讲解其功能的实现细节。

2015-07-07 20:39:55 722

原创【数据结构】堆栈和队列

堆栈和队列是两种极为常见的数据结构。这两种数据结构多少有点相对立的意思，一个是先进后出，一个是先进先出。概念上虽然很简单，很好理解，但其实其中有非常大的学问。在消息机制中这两种数据结构也有极大的应用，所以是两种应用很广的数据结构。堆栈堆栈的有进栈和出栈两种基本操作。进栈过程是数据由栈顶推入栈，由栈底开始逐一放置直到数据装满整个栈。出栈过程是数据由处于最上层的数据推出栈，直到栈底数据

2015-07-02 21:39:11 706

mychaint