Python
dingyaguang117
这个作者很懒,什么都没留下…
展开
-
pymongo的group操作
mongodb的group操作是将某个键值作为map的分组依据,然后每个分组的数据再通过reduce函数依次处理。其实group操作就是mapreduce的一个子集。下面是函数原型:group(key, condition, initial, reduce, finalize=None)key是需要分组的键,可以是listcondition是条件,和find的一样原创 2012-05-30 14:39:42 · 7149 阅读 · 0 评论 -
新浪发布带图片的微博[multipart/form-data格式上传文件]
在使用新浪微博的API更新一条带图片的微博时,需要使用multipart/form-data风格的POST可以参考这篇RFC http://www.ietf.org/rfc/rfc1867.txt需要在request头设置Content-typeContent-type = multipart/form-data; boundary=xxxx其中 boundary=xxxx很重要,原创 2012-03-13 19:16:35 · 5647 阅读 · 2 评论 -
Python sort sorted函数详解
一、sort函数sort函数是序列的内部函数函数原型:L.sort(cmp=None, key=None, reverse=False)函数作用:它是把L原地排序,也就是使用后并不是返回一个有序的序列副本,而是把当前序列变得有序参数说明:(1) cmp参数cmp接受一个函数,拿整形举例,形式为:def f(a,b):原创 2012-02-06 18:53:22 · 36572 阅读 · 1 评论 -
Python执行系统命令并获得输出的几种方法
方法一:import osp = os.popen('uptime')x=p.read()print x方法二:import subprocessres = subprocess.Popen('uptime',shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE,close_fds=True)原创 2012-02-06 11:21:45 · 21789 阅读 · 0 评论 -
python实现支持unicode中文的AC自动机
最近开始从分析数据,要从大量短文本中匹配很多关键字,如果暴力find的话,发现CPU成为了瓶颈,于是想到了AC自动机AC自动机是多模式匹配的一个经典数据结构,原理是和KMP一样的构造fail指针,不过AC自动机是在Trie树上构造的,但原理是一样的。为了能够匹配unicode,我讲unicode编码之后,按照每4位进行索引,变成了16叉trie树。其实这种事情应该用C/C++来写的,不原创 2012-05-26 12:01:24 · 5157 阅读 · 0 评论