python版本
windows上使用的是python2.7.2, 32位版本。
如何查看python是32位还是64位:
import struct
struct.calcsize("P")
如果是4,说明是32位的;如果是其他的是,64位的。struct.calcsize用于计算格式字符串所对应的结果长度。
ipython
一个比默认python shell好用的命令行工具:
http://ipython.org/documentation.html
它在MS Windows上运行依赖于pyreadline,于是用下面命令行安装:
easy_install pyreadline
经查证,pyreadline提供了命令行下的颜色服务。
使用:在命令行cmd下键入 ipython就可以使用,退出只需敲 exit
要用matplotlib based python (免除再次键入imoprt numpy等),可以用如下命令:
ipython --pylab
特点:敲击TAB键可以自动补全。
ipython 还能帮助查看引用的模块是否正确:例如自己写了一个controlMysql.py的模块,但调用这个模块的一个类的时候总是会出现这样的错误——AttributeError: 'module' object has no attribute 'ControlMysql'。在ipython 中检查,首先import该模块,然后输入模块名称,敲入?,即 controlMysql? 得到这样的返回结果
File: /Users/***/nostuck/ReadExcel/dbscripts/controlMysql.pyc
和自己预想的不同,修改之,解决模块引入的问题。
spyder
matplotlib
numpy
scipy
NetworkX
setuptools
nltk
自然语言处理工具集,能够分词、语法分析等,还提供了丰富的语料库来做实验
>>> import nltk >>> nltk.corpus.gutenberg.fileids() ['austen-emma.txt', 'austen-persuasion.txt', 'austen-sense.txt', 'bible-kjv.txt', 'blake-poems.txt', 'bryant-stories.txt', 'burgess-busterbrown.txt', 'carroll-alice.txt', 'chesterton-ball.txt', 'chesterton-brown.txt', 'chesterton-thursday.txt', 'edgeworth-parents.txt', 'melville-moby_dick.txt', 'milton-paradise.txt', 'shakespeare-caesar.txt', 'shakespeare-hamlet.txt', 'shakespeare-macbeth.txt', 'whitman-leaves.txt'] |
>>> emma = nltk.corpus.gutenberg.words('austen-emma.txt') >>> len(emma) 192427 |
scikits-learn
PyML
chardet
>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
import chardet
input=file.open("D://hello.txt")
str=input.readline()
chardet.detect(str)
input.close
结果诸如:
Python Imaging Library (PIL)
网站网址:http://www.pythonware.com/products/pil/
用于图片处理的强大工具,最简单的一个应用例子就是将图片从jpg格式转换为eps.