自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

forfuture1978的专栏

道生一,一生二,二生三,三生万物

  • 博客(43)
  • 资源 (1)
  • 收藏
  • 关注

原创 完整长尾理论读书笔记

长尾理论读书笔记:序言http://blog.csdn.net/forfuture1978/archive/2010/02/12/5307345.aspx长尾理论读书笔记:第一章 长尾市场http://blog.csdn.net/forfuture1978/archive/2010/02/12/5307610.aspx长尾理论读书笔记:第二章 大热门的兴衰起伏htt

2010-02-28 21:38:00 1598

原创 人生成功生涯规划100诀

生涯规划诀窍100则,系从江文雄:生涯规划一书中,摘要其重点内容供参考。如果您能将这100诀,经常阅读、反思,人生必然不断成长、精进,更为圆融、得众。愿彼此共勉之。01. 生涯即人生、生涯即竞争,生涯规划就是个人一生的竞争策略规划。02. 生涯要规划,更要经营,起点是自己,终点也是自己,没有人能代劳。03. 生涯规划就是规划人生的远景,彩绘生命的蓝图,发挥自己的才能,写

2010-02-28 01:04:00 1325

原创 Notes for Hadoop the definitive guide

1.       Introduction to HDFS 1.1.     HDFS Concepts 1.1.1.      Blocks l         HDFS too has the concept of a block, but it is a much larger unit 64 MB by default.    l    

2010-02-27 23:17:00 1509 1

原创 长尾理论读书笔记:第十四章 长尾法则

我们可以把创造一个繁荣长尾的秘诀归结为两句话: 提供所有的产品:这一条说起来容易做起来难,版权问题和法律限制始终是长尾市场最大的成长障碍。 帮我找到他:通过过滤器和用户打分,推荐技术,可以将需求推向长尾。 降低成本 法则一:让存货集中或分散 大型集中化的仓库在邮购业务上的优势实现了效率的第一次提升。 虚拟库存也即产品放在合伙人仓库中,而在网站上展示和出售,使得亚马逊成本几乎

2010-02-27 22:13:00 1155

原创 长尾理论读书笔记:第十三章 娱乐业之外

1、eBay eBay已经成为世界上最大的零售商之一,每天的成交额超过1亿美元,基本相当于沃尔玛的销量。 eBay既是产品的长尾,也是交易者的长尾,它是一个典型的用户自创市场,eBay本身只是一个协调人而已。 eBay是围绕分散化存货的概念运转的,它只是提供了一个网站,让买家和卖家在这个网站上自行接触,自行商议价格,所以它的存货成本是零。 eBay也是一种自我服务模式,卖家创建自己的产品列

2010-02-27 20:50:00 912

原创 Java面试题每日五题(2010/02/26)

问题1.public static void append(String str){ str += " Append!"; } public static void append(StringBuffer sBuffer){ sBuffer.append(" Append!"); } public void test(){ String str = "Nothi

2010-02-27 15:49:00 1085 4

原创 余世维成功经理人讲座

 一个人,重要的不是你的专业技能,不是你的社会经验,而是你的思维方式和思考能力。 ——杰克·韦尔奇 1、经理人常犯的11个错误1.1、拒绝承担个人的责任不要常常讲:我以为。 生活中有两种人: —种人不停的表现 —种人努力的辩解 杜鲁门总统的门上的字:麻烦到此为止。 观察你自己,别光是观察市场/管区/办公室。 有效的管理者,会为事情的结果,负起责任

2010-02-25 01:37:00 2113 1

Lucene 3.0 原理与代码分析

 本系列文章将详细描述几乎最新版本的Lucene的基本原理和代码分析。其中总体架构和索引文件格式是Lucene 2.9的,索引过程分析是Lucene 3.0的。鉴于索引文件格式没有太大变化,因而原文没有更新,原理和架构的文章中引用了前辈的一些图,可能属于早期的Lucene,但不影响对原理和架构的理解。本系列文章尚在撰写之中,将会有分词器,段合并,QueryParser,查询语句与查...

2010-02-24 11:04:43 91

原创 长尾理论读书笔记:第十二章 无限的荧屏

今天,最令广告商们垂涎欲滴的18岁到34岁男性消费者对电视的兴趣已经盛极而衰了,更具互动性的互联网和视频游戏正在赢得眼球争夺战。电视业是最有可能被长尾力量彻底改变的了:电视业创造出的内容比其他任何媒体和娱乐业都多:每年原创电视时长达3100万小时。 你只能看到其中很小的一部分:一个普通家庭的100个频道一年播出的节目总量不足10% 电视业的内容创作量与可获得量之比超

2010-02-24 01:02:00 1172 1

原创 长尾理论读书笔记:第十一章 利基文化

长尾的意义无非就是无限的选择。充足,廉价的传播渠道意味着丰富,廉价和无穷无尽的品种,也就意味着消费者们的兴趣可能会像产品种类一样分散。从共同兴趣转向特殊兴趣的趋势,并不意味着传统力量结构的终结,而只是等式的重新平衡,只是"或"时代向"和"时代的演变:过去我们只能选择畅销的或非畅销的产品,现在我们可以同时选择畅销的和非畅销的产品。今天,我们的文化越来越像是头部和尾部的混合,职业者和业余者的混合。

2010-02-24 00:45:00 1436

原创 长尾理论读书笔记:第十章 选择的天堂

我们正处在一个品种大爆炸的时代,全球化的浪潮和随之诞生的高效供应链是很重要的一个原因。然而面对眼花缭乱的选择,我们承受的住吗?2004年一本《选择的悖论》中描述了一次消费者行为的研究,在一个食品商店中,可以让顾客免费品尝一系列不同种类的果酱,一次有6种口味,一次又24种口味,结果品尝了6种口味的顾客中有30%买了一罐果酱,而品尝了24种口味的顾客中仅仅3%购买了果酱,于是得出结论,选择太多

2010-02-23 21:55:00 1300

原创 Lucene 3.0 原理与代码分析

本系列文章将详细描述几乎最新版本的Lucene的基本原理和代码分析。其中总体架构和索引文件格式是Lucene 2.9的,索引过程分析是Lucene 3.0的。鉴于索引文件格式没有太大变化,因而原文没有更新,原理和架构的文章中引用了前辈的一些图,可能属于早期的Lucene,但不影响对原理和架构的理解。本系列文章尚在撰写之中,将会有分词器,段合并,QueryParser,查询语句与查询对象

2010-02-22 23:39:00 2229 2

原创 长尾理论读书笔记:第九章 货架争夺战

这一章,我们将回到幂律曲线的左端,谈一谈货架的优势和成本。成功的长尾集合器既需要冷门产品,也需要大热门产品,它们必须跨越整个多样性光谱,从吸引面最宽的流行产品一直延伸到吸引面最窄的另类产品,唯有如此,它们才能整合信息资源,指明一条对所有人都有意义的长尾探索之路。如果你只有头部的产品,你会发现你的顾客有很多要求是你无法满足的,如果你只有尾巴中的产品,你会发现顾客会手足无措,不知道从哪里看起。

2010-02-22 23:33:00 1390

原创 长尾理论读书笔记:第八章 长尾经济学

只要消费市场存在,幂律曲线就会在以下三个条件成立的情况下出现:多样性:有很多不同种类的事物 不平等性:某些事物的质量高于其他事物 存在某种网络效应:不如声誉或口头传播效应,这些效应容易将质量的差别成倍放大。 幂律曲线会造成市场,文化,社会的一种"可预见的不平衡":成功带来更多的成功。如果在纵轴和横轴都用对数刻度来绘制幂律曲线的时候,应该汇出一条向下倾斜的直线。但是现

2010-02-21 23:09:00 1693

原创 长尾理论读书笔记:第七章 新时尚领军人

曾几何时,捧红一张唱片只有一种方法:广播。MTV在20世纪80年代问世,变成了制造大热门的第二个途径。然而如今,人们对广告和花钱做广告的机构已经不再那么信任,对个人的信心却呈上升之势。同类人相信同类人。自上而下的宣传正在失去效力,自下而上的传言正在赢得力量。从单个产品到某一个人,这样的力量逆转正在改变一切事物的营销游戏。大众群体现在已经控制了宣传信息。对于习惯于使用搜索引擎来评判产品的新一

2010-02-18 17:43:00 1303

原创 长尾理论读书笔记:第六章 新市场

二手书市场是由两个截然不同的市场组成,一部分是教科书,校园交易是这个市场的核心,具有超强的流动性,商品种类相对较少,买家和卖家多如牛毛,容易以合适的价格买到中意的产品,但就存货会因为版本的更新而被清洗一次。一部分是非学术用书,流动性较差,商品种类很多,买家和卖家数量不足,找到合意产品的概率很小。Alibris就是一个长尾集合器,将上万家二手书店的藏书连为一体,用信息的力量在一个原本缺乏流动性的

2010-02-17 17:57:00 1638

转载 O'Reilly总裁提姆-奥莱理:什么是Web 2.0

译者序:Web 2.0这一概念,由OReilly媒体公司总裁兼CEO提姆·奥莱理提出。他是美国IT业界公认的传奇式人物,是“开放源码”概念的缔造者,一直倡导开放标准,并活跃在开放源码运动的最前沿。 这篇由提姆·奥莱理亲自执笔、创作于上个月由他主办的Web 2.0会议前夕的文章,一经发出就引发了热烈的讨论,被视为Web 2.0迄今为止的经典之作。 Web2.0的一个关键原则是用户越多,服务

2010-02-15 20:50:00 2135

原创 长尾理论读书笔记:第五章 新生产者

专业-业余联合运动诞生于生产工具的普及:苹果公司Mac电脑附送的车库乐队可以"录下你的下一曲大热门",数字摄影机和桌面编辑软件产生了一个个家中电影制作人,博客使得在线出版轻而易举。我们正在由被动消费者转变为主动生产者,业余的博客正在同主流媒体争夺注意力,默默无闻的乐队正在网上发行没有标签的音乐,孩子们可以用电子游戏软件制作自己的电脑动画短片。已经有数百万人掌握了做一业余制作人所必需的工具和行动

2010-02-15 20:29:00 1243

原创 长尾理论读书笔记:第四章 长尾的三种力量

我们的文化和经济中心正在加速转移,从需求曲线头部的少数大热门转向需求曲线尾部的大量利基产品和市场。在一个没有货架空间的限制和其他供应瓶颈的时代,面向特定小群体的产品和服务可以和主流热点具有同样的经济吸引力。长尾时代的6个主题:利基产品都远远多于热门产品。随着生产技术的越来越廉价,利基产品的比重也越来越高。 获得利基产品的成本正在显著下降。数字传播,搜索技术,宽带使得一些市场已经

2010-02-14 14:26:00 3692

原创 长尾理论读书笔记:第三章 长尾简史

长尾是一系列商业创新的巅峰,这些创新主要体现在生产,供应,配送和销售商品的方法上,比如互联网购物得以实现的所有非互联网要素:联邦快递,国际标准图书编号,信用卡,关系型数据库以及条形码。互联网所发挥的作用就是使企业能够把各种创新融合在一起,增强其实力,拓展其市场范围。19世纪末期,全球第一批大型中央仓库出现。铁路运输网络能够把五花八门的产品送往各地。邮购分类目录包含了几十万种不同商品的信息。

2010-02-13 23:47:00 1498

原创 长尾理论读书笔记:第二章 大热门的兴衰起伏

在工业革命之前,大多数文化都是本地化的。现代工业的崛起造成了城市化浪潮,使得形形色色的人能够聚集在一起。商用印刷技术,摄影技术,留声机的发明,激发了第一次流行文化大潮——杂志,小说,书籍,乐谱、20世纪,电影技术的发明提供了舞台明星在多个城市同时登台的机会。这些文化载体可以跨越时空的联结不同的人,创造一个同步性的社会。广电媒体使得一次广播就能够接触到方圆几十里之内的每一个人。

2010-02-13 09:49:00 1364

原创 长尾理论读书笔记:第一章 长尾市场

网络世界具有强大的口耳相传的威力,并且将两种东西结合在了一起:一是无限的货架空间,二是有关购买趋势和公众观念的实时信息。消费者能找到的越多,他们喜欢的越多,当他们冲破陈旧的老路,走进广阔的网络天地时,他们发现他们的品味并不像自己想象的那样主流,是强大的营销手段,亦步亦趋的流行文化和狭窄的选择空间使得他们误导了自己。我们所认定的流行品味实际上只是供需失衡的产物,而供需失衡就是市场对无效分配的

2010-02-12 15:33:00 1787

原创 长尾理论读书笔记:序言

曾经,追捧畅销榜是人们的一种情结。大热门统治了一切。然而这种初现于战后广播电视时代的景象已经开始渐渐消退。当前的青年,也是广告商们最理想的宣传对象,正开始彻底抛弃电视,将越来越多的时间应用在网络和视频游戏上。广播电视有一个很了不起的地方,就是它可以用无可匹敌的效率将一个节目传送到数百万人面前,但是相反的事情它却做不到,即将数百万节目传送到一个人面前,而这一点正是互联网的强项。文化大热门

2010-02-12 11:14:00 1605

原创 Notes for Advanced Linux Programming - 6. Devices

6.  DevicesA device driver hides the hardware device’s communicationprotocols from the operating system and allows the system to interact with thedevice through a standardized interface.Pr

2010-02-11 16:17:00 738

原创 Notes for Advanced Linux Programming - 5. Interprocess Communication

 5.  Interprocess CommunicationFive types of interprocess communication:Shared memory permits processes to communicate by simplyreading and writing to a specified memory location.Mapped me

2010-02-11 13:47:00 1036

原创 Notes for Advanced Linux Programming - 4. Threads

4.  ThreadsTo use the POSIX standard thread API (pthreads), link libpthread.soto your program.4.1. Thread CreationEach thread in a process is identified by a thread ID,pthread_t.The

2010-02-11 13:19:00 1007

原创 Notes for Advanced Linux Programming - 3. Processes

 3.  ProcessesEach process is identified by its unique process IDEvery process has a parent process.Processes are arranged in a tree, with the init process atits rootA program can obtain

2010-02-11 12:56:00 669

原创 Notes for Advanced Linux Programming - 2. Writing Good GNU/Linux Software

2. Writing Good GNU/Linux Software2.1. Interaction With the Execution Environment2.1.1. Command LineWhen a program is invoked from the shell, the argument list contains the entire both the n

2010-02-11 11:56:00 747

原创 Notes for Advanced Linux Programming - 1. Getting Started

1. Getting Started1.1. Compiling with GCC1.1.1. Create the source code files(main.c) C source file—main.c#include #include “reciprocal.hpp”int main (int argc, char **argv){   

2010-02-11 11:54:00 781 1

原创 有关Lucene的问题(4):影响Lucene对文档打分的四种方式

在索引阶段设置Document Boost和Field Boost,存储在(.nrm)文件中。如果希望某些文档和某些域比其他的域更重要,如果此文档和此域包含所要查询的词则应该得分较高,则可以在索引阶段设定文档的boost和域的boost值。这些值是在索引阶段就写入索引文件的,存储在标准化因子(.nrm)文件中,一旦设定,除非删除此文档,否则无法改变。如果不进行设定,则Document ...

2010-02-09 00:00:48 104

原创 有关Lucene的问题(4):影响Lucene对文档打分的四种方式

在索引阶段设置Document Boost和Field Boost,存储在(.nrm)文件中。如果希望某些文档和某些域比其他的域更重要,如果此文档和此域包含所要查询的词则应该得分较高,则可以在索引阶段设定文档的boost和域的boost值。这些值是在索引阶段就写入索引文件的,存储在标准化因子(.nrm)文件中,一旦设定,除非删除此文档,否则无法改变。如果不进行设定,则Document

2010-02-08 23:46:00 2884 2

原创 有关Lucene的问题(3): 向量空间模型与Lucene的打分机制

问题:在你的文章中提到了:于是我们把所有此文档中词(term)的权重(term weight) 看作一个向量。    Document = {term1, term2, …… ,term N}    Document Vector = {weight1, weight2, …… ,weight N}    同样我们把查询语句看作一个简单的文档,也用向量来表示。    Que...

2010-02-06 12:44:00 137

原创 有关Lucene的问题(2):stemming和lemmatization

问题:我试验了一下文章中提到的 stemming 和 lemmatization 将单词缩减为词根形式,如“cars”到“car”等。这种操作称为:stemming。 将单词转变为词根形式,如“drove”到“drive”等。这种操作称为:lemmatization。 试验没有成功 代码如下:public class TestNorms {     

2010-02-06 12:42:00 1163

原创 有关Lucene的问题(2):stemming和lemmatization

问题:我试验了一下文章中提到的 stemming 和 lemmatization 将单词缩减为词根形式,如“cars”到“car”等。这种操作称为:stemming。 将单词转变为词根形式,如“drove”到“drive”等。这种操作称为:lemmatization。 试验没有成功 代码如下:public class TestNorms {        publ...

2010-02-06 12:40:31 221

原创 Lucene学习总结之四:Lucene索引过程分析(4)

6、关闭IndexWriter对象代码:writer.close(); --> IndexWriter.closeInternal(boolean)       --> (1) 将索引信息由内存写入磁盘: flush(waitForMerges, true, true);       --> (2) 进行段合并: mergeScheduler.merge(t...

2010-02-03 23:01:55 111

原创 Lucene学习总结之四:Lucene索引过程分析(3)

5、DocumentsWriter对CharBlockPool,ByteBlockPool,IntBlockPool的缓存管理在索引的过程中,DocumentsWriter将词信息(term)存储在CharBlockPool中,将文档号(doc ID),词频(freq)和位置(prox)信息存储在ByteBlockPool中。 在ByteBlockPool中,缓存是分块(slice)分配...

2010-02-03 23:00:31 120

原创 Lucene学习总结之四:Lucene索引过程分析(2)

3、将文档加入IndexWriter代码:writer.addDocument(doc); -->IndexWriter.addDocument(Document doc, Analyzer analyzer)      -->doFlush = docWriter.addDocument(doc, analyzer);           --> DocumentsW...

2010-02-03 22:50:29 119

原创 Lucene学习总结之四:Lucene索引过程分析(1)

对于Lucene的索引过程,除了将词(Term)写入倒排表并最终写入Lucene的索引文件外,还包括分词(Analyzer)和合并段(merge segments)的过程,本次不包括这两部分,将在以后的文章中进行分析。Lucene的索引过程,很多的博客,文章都有介绍,推荐大家上网搜一篇文章:《Annotated Lucene》,好像中文名称叫《Lucene源码剖析》是很不错的。想要真正了解...

2010-02-03 22:47:42 156

原创 Lucene学习总结之二:Lucene的总体架构

Lucene总的来说是: 一个高效的,可扩展的,全文检索库。 全部用Java实现,无须配置。 仅支持纯文本文件的索引(Indexing)和搜索(Search)。 不负责由其他格式的文件抽取纯文本文件,或从网络中抓取文件的过程。 在Lucene in action中,Lucene 的构架和过程如下图, 说明Lucene是有索引和搜索的两个过程,包含索引创建,索引,搜索三个要点。 让我们更细一些看Lucene的各组件: 被索引的文档用

2010-02-02 21:50:00 627

原创 Lucene学习总结之四:Lucene索引过程分析(4)

6、关闭IndexWriter对象代码:writer.close(); --> IndexWriter.closeInternal(boolean)       --> (1) 将索引信息由内存写入磁盘: flush(waitForMerges, true, true);       --> (2) 进行段合并: mergeScheduler.merge(this)

2010-02-02 02:09:00 2177

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除