最近迷上了python,感觉python的语法简洁,功能丰富又强大。容易上手,学习曲线不像其他语言那么陡峭。
现在还有时间,可以将机器学习的算法和优化算法,用python来实现一下,不能一直都拿他们当黑盒来用。
试了试numpy 和scipy ,很给力!
以前用python 写过一个多线程的爬虫,长时间抓取网页,结果出现了内存泄露,一直都找到原因,抓取个两三个小时就会因为内存爆掉而停止。
因为这个,看了看python源码剖析这本书,只看了前面几章,认识了很多python的基本类型的实现,整数对象,代码对象,缓冲池,垃圾回收等。
早就知道了python这种有GIL的语言,用多线程并发不给力。结果在网上又看到了stackless,一种比进程更加精致的结构,tasklet。
综上,python真是要什么有什么,开发web有Dijango,twisted,多进程,并行计算有pp,高并发有stackless,游戏有pyGame,等等~~~
实在不行还可以用C写扩展,或者用Ctype直接调用C模块,高端啊~~~
白话了这么多,现在总结一下今天看到的几个技巧:
List 推导: 很方便的对List进行操作
[x for x in xrange(10) if x %2==0]
enumerate():在遍历的同时会加上索引 不用自己去建立一个变量来记录了
seq = ['one','tow','three']
for i,item in enumerate(seq):
seq[i] = '%d : %s'%(i,seq[i])
iter():这个是迭代器,内置的,自己也可以编写,只要实现next()函数,以及返回 __iter__ 实例的方法就ok
i = iter("abcd")
print i.next()
print i.next()
print i.next()
print i.next()
print i.next()
生成器: 关键字 yield, 两种使用方式:
第一种,返回某个值,同时保存执行环境,直到调用next()函数,才继续程序
def loop():
i = 1
while 1:
yield i
i+=1
b = loop()
print b.next()
print b.next()
b.close()
print b.next()
第二种, yield 用括号括起来,当程序执行到此处,会等待 send() 发来的参数,同时保存执行环境,如果执行了send() 那就会继续执行
def loop():
while 1:
i = (yield)
print i
b = loop()
b.next()
b.send("hello")
b.send("world")
b.close()