365天

做喜欢的事

最佳论文:构建高性能的重复数据删除系统

USENIX年度会议(USENIX Annual Technical Conference)是计算机体系结构的顶级会议之一,每年举办一次。2011年ATC会议的最佳论文奖被来自赛门铁克的一篇论文摘得:Building a High-performance Deduplication System。...

2011-12-26 15:05:19

阅读数 3800

评论数 2

磁盘分区

有台服务器的分区不太合理,今天重新给分了一下,顺便整理一下资料。 1 概念 通常新买回来的电脑,都习惯先对磁盘进行分区。磁盘分区就是将一块物理磁盘分为好几个逻辑存储单元,这几个单元之间互相独立,从外部看就好像有多块物理磁盘。分区编辑软件(比如fdisk)可以对磁盘执行创建、删除分区等操...

2011-12-22 15:57:09

阅读数 1413

评论数 0

大话存储

这本书买了一年了,最近终于比较完整的读了一遍,感觉收获不少,应该写一篇读后感吧。 首先这本书是讲存储的,市面上关于存储的书少之又少,好书就更是稀缺资源,这本书可以说一定程度上弥补了资料的缺失。书里几乎涉及到了存储的方方面面,涵盖了磁盘、RAID、FC、SAN、NAS、备份等各个方向。这本书里不仅...

2011-12-09 21:11:51

阅读数 3940

评论数 1

关联规则挖掘(二):Apriori算法

1 算法简介 在数据挖掘领域,Apriori算法是挖掘关联规则的经典算法。Apriori算法采用的是自底向上的方法,从1-频繁集开始,逐步找出高阶频繁集。 它的基本流程是:第一次扫描交易数据库D时,产生1-频繁集。在此基础上经过连接、修剪产生2-频繁集。以此类推,直到无法产生更高阶的频繁集...

2011-12-08 21:11:04

阅读数 12303

评论数 1

关联规则挖掘(一):基本概念

本文主要来自《数据仓库和数据挖掘》一书,这本书讲的和维基百科里的非常相似,怀疑是从某本外文书籍里翻译过来的。 关联规则挖掘(Association rule mining)是数据挖掘中最活跃的研究方法之一,可以用来发现事情之间的联系,最早是为了发现超市交易数据库中不同的商品之间的关系。 这...

2011-12-07 11:04:44

阅读数 26689

评论数 3

Linux文件系统

从图书馆借的《Linux文件系统》,作者是Moshe Bar,他还写了另一本书叫《Linux internals》,应该说还是挺牛的。 但是翻看了几页后,终于忍不住给还了回去,因为翻译太烂了,而且有些古老。 首先说说翻译,除了有些不流畅外,最让人不能忍受的是通篇充斥了缓冲区、缓冲区缓存、缓存这...

2011-12-06 14:16:19

阅读数 1444

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭