- 博客(10)
- 资源 (44)
- 收藏
- 关注
转载 Java正则表达式详解
<br />如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一个用来搜索匹配字符串的模式。许多语言,包括Perl、PHP、Python、JavaScript和JScript,都支持用正则表达式处理文本,一些文本编辑器用正则表达式实现高级“搜索-替换”功能。那么Java又怎样呢?本文写作时,一个包含了用正则表达式进行文本处理的Java规范需
2010-08-21 19:22:00 375
转载 用Python来写MapReduce的实际应用程序
<br />前几篇介绍了MapReduce环境的搭建,我们来做些更有实际意义的事情吧,用Python来写分布式的程序。这样速度快。便于调试,更有实际意义。<br />个人感觉MapReduce适合于对文本文件的处理及数据挖掘用:<br /> 在每台机器上:<br />su - hadoop<br />wget http://www.python.org/ftp/python/3.0.1/Python-3.0.1.tar.bz2<br />tar jxvf Python-3.0.1.tar.bz2<br
2010-08-15 16:40:00 932
转载 sql聚合函数
<br />sql 聚合函数<br />1.AVG AVG ( [ ALL | DISTINCT ] expression )<br /> <br />参数 <br />ALL<br /> 对所有的值进行聚合函数运算。ALL 是默认值。<br />DISTINCT<br /> 指定 AVG 只在每个值的唯一实例上执行,而不管该值出现了多少次。<br />expression<br /> 是精确数值或近似数值数据类别(bit 数据类型除外)的 表达式。不允许使用聚合函数和子查询
2010-08-15 16:10:00 751
转载 MySQL去除查询结果重复值 distinct 的用法
<br />转自: phpv作者:索尔内容:作者学习distinct的过程,值得借鉴啊 ^^ -------------------------------------------------------------------------------- <br />在使用mysql时,有时需要查询出某个字段不重复的记录,虽然mysql提供有distinct这个关键字来过滤掉多余的重复记录只保留一条,但 往往只用它来返回不重复记录的条数,而不是用它来返回不重记录的所有值。其原因是distinct只能返回它的
2010-08-15 15:11:00 601
转载 group by 和Having
GROUP BY 是分组查询, 一般 GROUP BY 是和 聚合函数配合使用,你可以想想你用了GROUP BY 按 ITEM.ITEMNUM 这个字段分组,那其他字段内容不同,变成一对多又改如何显示呢,比如下面所示A B1 abc1 bcd1 asdfgselect A,B from table group by A你说这样查出来是什么结果,A B abc 1 bcd asdfg右边3条如何变成一条,所以需要用到
2010-08-15 14:58:00 530
转载 文字式网页浏览器w3m (默认快捷键列表)
<br />刚接触到linux的时候就知道了lynx此老古董式的网页浏览器,所谓是宝刀哈<br />之后玩linux都是在xwindow下捣弄<br />前不久翻看了下lynx的使用方法,之后就知道了w3m,在ubuntu7.10上默认是安装了w3m的,用起来还不错<br />因为之后想在命令行模式下认认真真的去学习linux<br /><br />w3m的一般使用方法就是:$w3m url //e.g $w3m baidu.com<br /><br />w3m:WWW browsable pager
2010-08-15 14:29:00 844
转载 left join 和 left outer join
通俗的讲: A left join B 的连接的记录数与A表的记录数同 A right join B 的连接的记录数与B表的记录数同 A left join B 等价B right join A table A: Field_K, Field_A 1 a 3 b 4
2010-08-15 14:21:00 883
转载 MapBalanceReduce介绍
目的:1、从根本上解决reduce时的数据倾斜问题2、从根本上解决基于优先级的并发调度问题Map-Balance-Reduce (简称MBR)是在现有Map-Reduce模型基础之上的改进,以从根本上解决reduce倾斜问题,不用预先分析KEY的分布,编程接口在map和reduce之外,增加balance,但是只有在不均衡的时候balance才会被调用到。 如果某个Split大于设定的值,则再分割,如果某个Split小于指定的值,则和其它的合并(只需要逻辑上的合并,不需要物理上合并,这样对性能不会有影响)。
2010-08-13 10:06:00 515
转载 Hive简介
<br /><br />Hive 加速Map/Reduce的开发<br />一篇Google的学术论文让Map/Reduce这个概念风靡全球,Hadoop是Apache对Map/Reduce这种分布式计算框架的开源实现,通过Hive我们能想执行SQL那样执行我们的HadoopJob。一、Hive的安装<br />如何安装Hive网上有N多的文档,一般来说你准备搭建Hadoop平台的你就绝对不会吝啬这么点的时间去搭建个Hive平台,具体就参考官方wiki去吧。二、开启Hadoop之旅 1.Hive表的创建与维
2010-08-12 13:26:00 2258
谁说大象不能跳舞——郭士纳
2009-12-06
[(美国版)计算机爱好者].CPU.Magazine.Reference_Series_-_Xbox_360
2009-05-16
并行计算MPI The Complete Reference
2009-05-16
ApacheAnt1.7.1.zip
2009-05-16
正则表达式释疑(regular-expression)
2009-05-16
把java web应用包装成桌面应用的简单做法
2009-05-16
jQueryAPI_CHM.
2009-05-16
精通Oracle.10g.Pl.SQL编程.
2009-05-16
\Effective+Java侯捷中文版
2009-05-16
Linux命令大全(修改版).
2009-05-16
JavaScript对象与数组参考大全
2009-05-16
spring in action 中文版
2009-05-16
15天学会jQuery
2009-05-16
Flex+3+Cookbook.pdf
2009-05-16
《深入浅出Ext+JS》样章.pdf
2009-05-16
设计模式迷你手册.chm
2009-05-16
webwork开发指南
2009-05-16
Hadoop分布式文件系统
2009-03-13
Bigtable: A Distributed Storage System for Structured Data
2009-03-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人