- 博客(3)
- 收藏
- 关注
转载 Python的作用域
在这篇文章里,我们来关注作用域在Python被误用的地方。通常,当我们定义了一个全局变量(好吧,我这样说是因为讲解的需要——全局变量是不好的),我们用一个函数访问它们是能被Python理解的: 1 2 3 bar = 42 def foo(): print bar 在这里,我们在foo函数里使用了全局变量bar,然后它也如预想的能够正常运行: 1 2 >>> foo()
2015-04-24 17:41:52 492
原创 正则表达式学习笔记(一)
一、什么是正则表达式 在进行文本处理的时候,我们经常需要根据自己的需求提取某些特定的字符串,因而我们需要给计算机提供匹配模板,而这个模板就是正则表达式。正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 大部分时候我们见到的正则表达式都是以字符串的形式展现,如"w+\\.bai
2015-04-23 22:28:00 524
原创 如何去掉MapReduce输出的默认分隔符
我们在用MapReduce做数据处理的时候,经常会遇到将只需要输出键或者值的情况,如context。write(new Text(record), new Text("")),这样得到结果每行尾部会自动加上一个制表符。尽管我们的值是空的,但是MapReduce默认输出的是键值对,且键值对之间采用默认的分隔符为制表符,这样可能对我们数据的后续处理会产生一些干扰,那么如和去掉或是更改这个制表符呢?这里
2015-04-07 11:42:25 3607
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人