LippiOuYang-CSDN博客

转载 LevelDb原理剖析

LevelDb日知录之一：LevelDb 101　　说起LevelDb也许您不清楚，但是如果作为IT工程师，不知道下面两位大神级别的工程师，那您的领导估计会Hold不住了：Jeff Dean和Sanjay Ghemawat。这两位是Google公司重量级的工程师，为数甚少的Google Fellow之二。　　Jeff Dean其人：http://research.google.

2014-05-28 14:58:17 520

原创带缓冲I/O 和不带缓冲I/O详解

首先要明白不带缓冲的概念：所谓不带缓冲，并不是指内核不提供缓冲，而是只单纯的系统调用，不是函数库的调用。系统内核对磁盘的读写都会提供一个块缓冲，当用write函数对其写数据时，直接调用系统调用，将数据写入到块缓冲进行排队，当块缓冲达到一定的量时，才会把数据写入磁盘。因此所谓的不带缓冲的I/O是指进程不提供缓冲功能。每调用一次write或read函数，直接系统调用。而带缓冲的I/O是指进程对输入

2014-05-14 16:18:14 709

原创 LINUX下的TAILQ队列

队列，又稱為佇列（英文queue），是先进先出（FIFO, First-In-First-Out）的线性表。在具体应用中通常用链表或者数组来实现。FreeBSD中的TAILQ把整个队列头抽象为一个单独的数据结构，我们先看看FreeBSD中的TAILQ相关宏，然后再举例子理解这些宏。这里用最简单的一个结构体来理解TAILQ，这个结构体中有一个int型整数，还有两个分别指向前方和后方的指针。

2014-05-14 12:39:02 1661

翻译 FP-Growth算法简介

FP树FP Growth算法利用了巧妙的数据结构，大大降低了Aproir挖掘算法的代价，他不需要不断得生成候选项目队列和不断得扫描整个数据库进行比对。为了达到这样的效果，它采用了一种简洁的数据结构，叫做frequent-pattern tree(频繁模式树)。下面就详细谈谈如何构造这个树，举例是最好的方法。请看下面这个例子：这张表描述了一张商品交易清单，abcd

2014-01-16 22:37:05 1201

原创利用CART算法建立分类回归树

常见的一种决策树算法是ID3，ID3的做法是每次选择当前最佳的特征来分割数据，并按照该特征所有可能取值来切分，也就是说，如果一个特征有四种取值，那么数据将被切分成4份，一旦按某特征切分后，该特征在之后的算法执行过程中将不会在起作用，这种切分方法比较迅速，但是一个比较明显的缺点是不能直接处理连续型的特征，只有事先将连续型的数据转换成离散型才能再ID3算法中使用。CART(Classificati

2014-01-15 22:36:03 1359

原创 AdaBoost原理，算法实现

前言：当做重要决定时，大家可能综合考虑多个专家而不是一个人的意见。机器学习处理问题也是如此，这就是元算法背后的思路。元算法是对其他算法进行组合的一种方式，前几天看了一个称作adaboost方法的介绍，今天和大家分享一下。一、bagging算法：基于数据随机抽样的分类器构建方法自举汇聚法，也称为bagging算法，就是从原始数据集中选择S次后得到S个新数据集的一种技术。新数据集和原数据集

2013-12-31 17:26:39 4013 2

lippi

转载 LevelDb原理剖析

原创带缓冲I/O 和不带缓冲I/O详解

原创 LINUX下的TAILQ队列

翻译 FP-Growth算法简介

原创利用CART算法建立分类回归树

原创 AdaBoost原理，算法实现

空空如也

空空如也

转载 LevelDb原理剖析

原创 带缓冲I/O 和 不带缓冲I/O详解

原创 LINUX下的TAILQ队列

翻译 FP-Growth算法简介

原创 利用CART算法建立分类回归树

原创 AdaBoost原理，算法实现

空空如也

空空如也

原创带缓冲I/O 和不带缓冲I/O详解

原创利用CART算法建立分类回归树