365天

做喜欢的事

Redis的内存碎片

Redis默认使用jemalloc分配内存,根据fast'14的最佳论文的说法,当遇到变长key-value负载时,会出现碎片问题:内存利用率低,实际分配的内存比所需要的内存多。因此我用YCSB对Redis的内存进行了测试。 实验的第1阶段:向Redis插入100万条记录,key为20字节,va...

2014-10-29 16:02:02

阅读数 12350

评论数 1

Linux下几个比较好用的软件

在这里记录下几个比较好用的linux软件,不间断更新。 1. Mendeley 一句话广告:It’s time to change the way we do research. Mendeley是一个免费的引用管理和学术社交网络。而Mendeley Desktop是一个管理文献的客户端,我...

2012-05-08 20:20:20

阅读数 12603

评论数 3

谷歌技术"三宝"之BigTable

2006年的OSDI有两篇google的论文,分别是BigTable和Chubby。Chubby是一个分布式锁服务,基于Paxos算法;BigTable是一个用于管理结构化数据的分布式存储系统,构建在GFS、Chubby、SSTable等google技术之上。相当多的google应用使用了BigT...

2012-05-04 22:09:29

阅读数 74938

评论数 11

谷歌技术"三宝"之MapReduce

江湖传说永流传:谷歌技术有"三宝",GFS、MapReduce和大表(BigTable)! 谷歌在03到06年间连续发表了三篇很有影响力的文章,分别是03年SOSP的GFS,04年OSDI的MapReduce,和06年OSDI的BigTable。SOSP和OSDI都是操作系统...

2012-04-26 22:01:57

阅读数 129740

评论数 22

谷歌技术"三宝"之谷歌文件系统

题记:初学分布式文件系统,写篇博客加深点印象。GFS的特点是使用一堆廉价的商用计算机支撑大规模数据处理。 虽然"The Google File System " 是03年发表的老文章了,但现在仍被广泛讨论,其对后来的分布式文件系统设计具有指导意义。然而,作者在设计GFS时,是...

2012-04-21 17:28:31

阅读数 55697

评论数 11

使用math库遇到的错误

程序里需要使用pow函数,虽然我已经#include ,但是make的时候仍然出现错误:undefined reference to 'pow'。 在网上查找了一些解决方案,明白了math库是需要手动加上-lm链接的,但是仍有些问题不明白。 Q1:pow的参数如果是两个常数,则不加-lm也是正...

2012-04-09 22:03:26

阅读数 1732

评论数 0

三种二叉树遍历的非递归实现

今天偶然翻出了很久以前写的一篇博客,是关于三种二叉树遍历的非递归实现的,转到这儿来吧。程序都是伪代码,因为是考研复习期间写的,数据结构参考了严蔚敏的《数据结构》。 先看递归实现: void Traverse(BiTree T){ if(T){ //visit,先序遍历 T...

2012-04-09 20:43:02

阅读数 1672

评论数 0

主文件系统 vs 二级文件系统 (EMC篇)

文主要基于FAST11和FAST12的两篇论文:A study of practical deduplication和Characteristics of backup workloads in production systems。前者来自微软,主要分析的是用于主存储系统的文件系统;后者来自EM...

2012-03-19 21:32:15

阅读数 3080

评论数 0

主文件系统 vs 二级文件系统 (微软篇)

本文主要基于FAST11和FAST12的两篇论文:A study of practical deduplication和Characteristics of backup workloads in production systems。前者来自微软,主要分析的是用于主存储系统的文件系统;后者来自E...

2012-03-18 11:02:00

阅读数 3348

评论数 0

最佳论文:构建高性能的重复数据删除系统

USENIX年度会议(USENIX Annual Technical Conference)是计算机体系结构的顶级会议之一,每年举办一次。2011年ATC会议的最佳论文奖被来自赛门铁克的一篇论文摘得:Building a High-performance Deduplication System。...

2011-12-26 15:05:19

阅读数 3800

评论数 2

磁盘分区

有台服务器的分区不太合理,今天重新给分了一下,顺便整理一下资料。 1 概念 通常新买回来的电脑,都习惯先对磁盘进行分区。磁盘分区就是将一块物理磁盘分为好几个逻辑存储单元,这几个单元之间互相独立,从外部看就好像有多块物理磁盘。分区编辑软件(比如fdisk)可以对磁盘执行创建、删除分区等操...

2011-12-22 15:57:09

阅读数 1413

评论数 0

大话存储

这本书买了一年了,最近终于比较完整的读了一遍,感觉收获不少,应该写一篇读后感吧。 首先这本书是讲存储的,市面上关于存储的书少之又少,好书就更是稀缺资源,这本书可以说一定程度上弥补了资料的缺失。书里几乎涉及到了存储的方方面面,涵盖了磁盘、RAID、FC、SAN、NAS、备份等各个方向。这本书里不仅...

2011-12-09 21:11:51

阅读数 3940

评论数 1

关联规则挖掘(二):Apriori算法

1 算法简介 在数据挖掘领域,Apriori算法是挖掘关联规则的经典算法。Apriori算法采用的是自底向上的方法,从1-频繁集开始,逐步找出高阶频繁集。 它的基本流程是:第一次扫描交易数据库D时,产生1-频繁集。在此基础上经过连接、修剪产生2-频繁集。以此类推,直到无法产生更高阶的频繁集...

2011-12-08 21:11:04

阅读数 12303

评论数 1

关联规则挖掘(一):基本概念

本文主要来自《数据仓库和数据挖掘》一书,这本书讲的和维基百科里的非常相似,怀疑是从某本外文书籍里翻译过来的。 关联规则挖掘(Association rule mining)是数据挖掘中最活跃的研究方法之一,可以用来发现事情之间的联系,最早是为了发现超市交易数据库中不同的商品之间的关系。 这...

2011-12-07 11:04:44

阅读数 26689

评论数 3

Linux文件系统

从图书馆借的《Linux文件系统》,作者是Moshe Bar,他还写了另一本书叫《Linux internals》,应该说还是挺牛的。 但是翻看了几页后,终于忍不住给还了回去,因为翻译太烂了,而且有些古老。 首先说说翻译,除了有些不流畅外,最让人不能忍受的是通篇充斥了缓冲区、缓冲区缓存、缓存这...

2011-12-06 14:16:19

阅读数 1444

评论数 0

谁养鱼(四):遗传算法的实现

1 简介 根据达尔文的进化论,生物种群从低级、简单的类型逐渐发展成为高级、复杂的类型。各种生物要生存下去就必须进行生存斗争,具有较强生存能力的生物个体容易存活下来,并有较多的机会产生后代;具有较低生存能力的生物则被淘汰,或者产生后代的机会越来越少,直至消亡。 遗传算法借鉴了生物界自然选择、...

2011-11-28 19:13:30

阅读数 3828

评论数 2

谁养鱼(三):如何让计算机认识线索

在谁养鱼问题中给出了15条线索,如何让计算机识别这些线索,并作出正确的判断呢? 因为房子的顺序是固定,给它们编号1、2、3、4、5。每个房子都有五种类型的属性,分别是颜色、国籍、饮料、宠物、香烟,并且不同的房子之间相同类型的属性是不同的。 通过观察可以发现,线索可以分为三类:固定线索,绑定...

2011-11-25 21:52:44

阅读数 1682

评论数 0

谁养鱼(二):如何将排列映射到整数域

今天又考虑了一下谁养鱼的问题,觉得用遗传算法来解题值得一试,但是主要的难点有三: 如何让计算机理解线索?即如何表示绑定、相邻等关系?比如丹麦人喝茶的绑定关系,绿房子在白房子左边的左相邻关系等。问题空间和遗传空间如何转换?问题空间是红黄蓝绿白这样的排列,如何将其转换成遗传空间的二进制编码?也就...

2011-11-23 14:59:41

阅读数 2409

评论数 0

谁养鱼(一):人工解法

题目:据说有五个不同颜色的房间排成一排,每个房间里分别住着一个不同国籍的人,每个人都喝 一种特定品牌的饮料,抽一种特定品牌的烟,养一种宠物,没有任意两个人抽相同品牌的香烟,或喝相同品牌的饮料,或养相同的宠物,问题是谁在养鱼作为宠物? 为了寻找答案,给出了十五条线索: 英国人住在红色的房子...

2011-11-21 23:02:05

阅读数 2867

评论数 1

图灵机和NP难度问题

这学期选了NP难度这门课,挺感兴趣。但是在和同学讨论问题的时候,发现大家对NP难度的认识非常模糊,什么是P!=NP?什么是NP完全?什么是NP难度?都有自己的一套说法。于是自己去查阅了一些资料,可能存在理解不正确的地方,但尽量要把这些问题讲清楚。 关于NP方面的知识涉及到很多哲学和数学的内容,有...

2011-11-19 19:57:14

阅读数 10900

评论数 4

提示
确定要删除当前文章?
取消 删除
关闭
关闭