- 博客(17)
- 资源 (18)
- 收藏
- 关注
转载 hadoop资料
6、第六套是一套hadoop高级应该教程,在网上不多见,适合学习hadoop的人作为提升的很好的一套工具。教程名为《Hadoop高级应用实战(flume应用开发、搜索引擎算法、Pipes、集群、PageRank算法)》课程讲师:明义(robby)课程分类:Java涉及项目:搜索引擎自动推荐、PageRank算法、 最短路径算法、好友智能推荐用到技术:flume应用开发、Pipe
2013-07-23 19:11:32 1164
转载 java指令---dup
这里可以看到其中main方法主要做的Java代码 0 new jvm.study.Test [1] 3 dup 4 invokespecial jvm.study.Test() [16] 7 astore_1 [t] 8 return 这里有个dup指令。其作用就是复制之前分配的jvm.study.Test空间的引用并压入栈顶。那么这里为什么需要这样么做呢
2013-07-18 19:43:39 3361
转载 Google’s Jeff Dean talks about infrastructure, focus and recognizing cats
http://gigaom.com/2013/06/19/googles-jeff-dean-talks-about-infrastructure-focus-and-recognizing-cats/?go_commented=1#comment-1351555Jeff Dean, a Google Fellow who helped develop some of th
2013-07-16 19:46:16 866
原创 线程类加载器
线程上下文类加载器线程上下文类加载器(context class loader)是从 JDK 1.2 开始引入的。类 java.lang.Thread中的方法getContextClassLoader()和 setContextClassLoader(ClassLoader cl)用来获取和设置线程的上下文类加载器。如果没有通过 setContextClassLoader(ClassL
2013-07-16 16:13:21 1130
转载 R语言为Hadoop集群数据统计分析带来革命性变化
摘要:R作为开源的数据统计分析语言正潜移默化的在企业中扩大自己的影响力。特有的扩展插件可提供免费扩展,并且允许R语言引擎运行在Hadoop集群之上。 R语言是主要用于统计分析、绘图的语言和操作环境。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发。(也因此称为R)现在由R开发核心团队负...R作为开源的数据统计分析语言正潜移默化的在企业
2013-07-12 18:04:02 1123
转载 数据分析不使用Hadoop的五大理由
作为Hadoop 曾经的超级粉丝,Joe Brightly承认自己在很多方面非常热爱Hadoop,比如“可以处理PB级别的数据;可以扩展到数千个处理大量计算工作的节点;可以用非常灵活的方式存储和加载数据……”但当他部署Hadoop用于分析的时候,他才意识到它并不是无所不能。在Quantivo,Joe及其同事已经“探索了许多方法来部署Hadoop用于回答分析型查询”,直到最后,“它变得好像是
2013-07-12 17:54:11 979
转载 美国国家安全局如何监控互联网大数据
在《美国国家安全局如何分析手机通话数据》一文中我们了解到“图谱分析”是NSA分析手机用户通话数据最重要的技术手段,据NSA官员透露的文档,仅Verizon的用户通话数据的图谱分析项目,规模就已经超过了Facebook。除了结构化程度较高的通话数据外,NSA代号PRISM的超大规模数据挖掘项目能直接监测Google、Facebook、微软和苹果等九大互联网IT企业中央服务器中的各种结构化和非
2013-07-12 17:42:19 1949
转载 【ant】ant property 总结
特点 大小写敏感; 不可改变,先到先得,谁先设定,之后的都不能改变。 怎样设置1 、设置 name 和 value 属性值,比如: 2 、 设置 name 和 refid 属性值,比如: ,其中dao.compile.classpath 在别的地方定义。3 、设置 name 和 location 属性值,比如: ,即将 srcdir 的值设 置为:当前项目根
2013-07-12 16:07:33 1582
转载 hadoop过时了?
转载:http://www.ctocio.com/hotnews/7331.htmlHadoop这个单词如今铺天盖地,几乎成了大数据的代名词。仅仅数年时间,Hadoop从边缘技术迅速成长为一个事实标准。如今想玩转大数据,搞企业分析或者商业智能,没有Hadoop还真不行。但Hadoop狂热的背后却酝酿着一场技术变革,Hadoop的核心技术在Google那里已经过时,因为Hadoo
2013-07-12 14:48:33 1314
原创 datanucleus jar包
http://www.datanucleus.org/downloads/maven2/org/datanucleus/datanucleus-core/2.0.3/ 下载太慢改用http://repo1.maven.org/maven2/org/datanucleus/datanucleus-core/2.0.3/
2013-07-09 15:10:37 921
转载 Jeff Dean
Google 公司的 Jeff Dean在Stanford大学做了一个非常精彩的演讲(视频未墙)。我们每一个人都应该去看一看这个视频,没有字幕,需要不错的听力。下面是一些相关的Notes,供你参夸,并欢迎牛人指证。 ● 比较了从1999年到2010年十年来的搜索量的变化。搜索量增加了 1000 倍,而搜索速度快了5 倍。1999年,一个网页的更新最多需要一个月到
2013-07-05 10:59:47 1228
转载 YARN或将成为Hadoop新发力点
摘要:2013年的Hadoop峰会上,YARN是一个热点话题,YARN本质上是Hadoop的新操作系统,突破了MapReduce框架的性能瓶颈。Murthy认为Hadoop和YARN的组合是企业大数据平台致胜的关键。Yahoo!最初开发Hadoop,是为了用于搜索和索引Web网页,目前很多的搜索服务都是基于这个框架的,但是Hadoop从本质上来说还只是一个解决方案。2013年的Hado
2013-07-02 09:25:56 823
转载 DataTorrent 将数据分析速度从“实时”提升至“现在时”
摘要:初创公司DataTorrent可以将数据处理速度从实时提高至“现在时”。公司的创始人Hoang表示,该平台基于Hadoop 2.0创建,具有良好的扩展性和弹性负载,也不会出现数据丢失,而且该系统每秒钟可以处理上千万个数据项。大数据初创企业 DataTorrent刚刚获得了800万美元融资,这又是一家基于Hadoop的大数据创新企业,该公司的总部位于加州的圣克拉拉。DataTorr
2013-07-02 09:22:30 1311
转载 【vim】100 Vim commands every programmer should know
100 Vim commands every programmer should knowPublished on June 30th, 2008 by Jean-Baptiste Jung. 131 Comments -Since the 70′s, Vi is one of the programmer’s best friend. Nevermind you’re
2013-07-01 19:20:26 1151
转载 每个程序员都应该知道的论文和文章
http://projectmona.com/bits-of-brilliance-session-five/里面内容很杂但很丰富,是UIUC教授Jeff Erickson在编程方面的个人收集(其他收集可以参见:http://projectmona.com/bits-of-brilliance/ 包括费曼、尼采和特斯拉等等)。其中比较有价值的有:算法笔记:http://comp
2013-07-01 12:33:09 798
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人