自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 #读书笔记#互联网时代的软件革命——SaaS架构设计·第三章

Mutlti-tenant 中文翻译过来就是多租户。本章采用了Case的写作模式。讲了郭靖和杨过两个好基友的创业故事。一看这个写作风格,估计你不难猜出这是出自哪家公司的人之手。他俩的第一个项目来自杨过的一次偶遇。暑假的时候和做生意的叔叔聊天的时候,他发现叔叔的企业急需信息化来解决问题。他俩级回去搞了一个CRM系统。在需求设计参考了RUP(Rational unified Process)中的“

2013-02-05 17:33:00 863

原创 #读书笔记#大数据·互联网大规模数据挖掘与分布式处理 第二章

本章开始进入这本书的正文。最开始的第一章介绍了分布式文件系统(DFS)。信息爆炸时代带来的后果就是,单机处理计算能力已经更不上信息的增长速度了。在这种需求的启动下,用分布式系统来处理大规模数据的这种模式开始出现。由于此时,数据时分布在集群的不同单机中,文件系统自然要区别于单机。DFS便孕育而生。DFS所处理的文件有两个特点。a.存储单位比传统OS中的磁盘块要大很多;b.提供数据冗余机制来防

2013-02-04 17:33:17 791

原创 #读书笔记#大数据·互联网大规模数据挖掘与分布式处理 第一章

第一章只有薄薄的十四页,但先概述了数据挖掘的定义。也谈到了数据挖掘的局限性——邦弗兰妮原理。最后介绍了数据挖掘要用到的相关知识,如TD·IDF,Hash,Index,二级存储器,以及建模计算中需要用到的e,和幂定律。  虽然现在Data mining 炒的非常的火,但在几十年前,这个概念还是具有贬义色彩的,指过度抽取数据而不是信息的本身。很多人把机器学习等价于数据挖掘,事实上,二者是包含和被包

2013-02-01 20:48:59 815

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除