- 博客(3)
- 收藏
- 关注
原创 #读书笔记#互联网时代的软件革命——SaaS架构设计·第三章
Mutlti-tenant 中文翻译过来就是多租户。本章采用了Case的写作模式。讲了郭靖和杨过两个好基友的创业故事。一看这个写作风格,估计你不难猜出这是出自哪家公司的人之手。他俩的第一个项目来自杨过的一次偶遇。暑假的时候和做生意的叔叔聊天的时候,他发现叔叔的企业急需信息化来解决问题。他俩级回去搞了一个CRM系统。在需求设计参考了RUP(Rational unified Process)中的“
2013-02-05 17:33:00 863
原创 #读书笔记#大数据·互联网大规模数据挖掘与分布式处理 第二章
本章开始进入这本书的正文。最开始的第一章介绍了分布式文件系统(DFS)。信息爆炸时代带来的后果就是,单机处理计算能力已经更不上信息的增长速度了。在这种需求的启动下,用分布式系统来处理大规模数据的这种模式开始出现。由于此时,数据时分布在集群的不同单机中,文件系统自然要区别于单机。DFS便孕育而生。DFS所处理的文件有两个特点。a.存储单位比传统OS中的磁盘块要大很多;b.提供数据冗余机制来防
2013-02-04 17:33:17 791
原创 #读书笔记#大数据·互联网大规模数据挖掘与分布式处理 第一章
第一章只有薄薄的十四页,但先概述了数据挖掘的定义。也谈到了数据挖掘的局限性——邦弗兰妮原理。最后介绍了数据挖掘要用到的相关知识,如TD·IDF,Hash,Index,二级存储器,以及建模计算中需要用到的e,和幂定律。 虽然现在Data mining 炒的非常的火,但在几十年前,这个概念还是具有贬义色彩的,指过度抽取数据而不是信息的本身。很多人把机器学习等价于数据挖掘,事实上,二者是包含和被包
2013-02-01 20:48:59 815
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人