1、Preface
针对自身的纯知识点的汇总,<dive into python >整本书的内容模糊的以及认为需要着重记住的内容。
2、模块
所有的模块都有__name__内置属性,两种使用方式:
1、 直接导入模块,此时__name__就是模块名
2、 直接运行模块,此时__name__属性就是缺省的__main__
所以在大型程序开发过程中,做测试套件时候,可以使用__name__属性,当导入模块时候,__name__就是别的东西也不会产生影响。
3、getarr作为分发者使用
有HTML,XML,和普通文本格式打印站点统计的程序。
import odbhelper def output(data, format=”text”): output_function = getattr(odbhelper, “output_%s”%format) return output_function(data)
4、and or 组合的使用
a and bor c:如果a为真,返回b否则返回c(前提是b必须为真)
a and[b] or [c]:如果a为真,返回b否则返回c。(用列表即使b,c空,列表也不为空)
5、类属性和数据属性:
类属性定义在类中,相当于java中的静态变量,
数据属性定义在__init__方法中,相当于java中的实例变量。
6、私有定义规则:
Python函数,类方法,属性名字以两个下划线开始(但结束没有),是私有的。
所有的专有方法和内置属性的命名规则:开始和结束都有两个下划线。不要对自己的方法和属性用这种形式命名。
7、使用同一函数(minidom.parse)解析保存在web页面,本地文件和硬编码字符串的XML文档:
Web页面:urlopen得到类文件对象。
本地文件:open
直接硬编码字符串xml:StringIO.StringIO()(先转为类文件对象才可以使用minidom.parse)
8、HTTP重要特性:
1、 用户代理(user-agent):为了在出错时候方便服务器管理员联系客户端用户,需要告诉服务器在何时通过http请求一个web页,feed汇聚或其他类型的web服务。
默认的用户代理是Python-urllib/1.15(可能会有变化)
2、重定向(redirects):重定向就是网址的变化。
状态码:200:一切正常;404:页面没找到;302:临时重定向;301:永久重定向。
1、 最近修改(last-modified):页面里数据的更新。状态码304表示页面数据无更新。
2、 Etag与last-modeified类似。
3、 压缩(compression):对于服务器端传过来的文本的可能过大,需要压缩。只需在用户请求中包含Accept-encoding:gzip的头信息。
9、Urllib2获取HTTP资源
1、 创建request对象,接受一个url
2、 创建url开启器(opener),可以接受n个处理器来处理响应。
3、 用request对象告诉开启器打开url。
import urllib2 request=urllib2.Request(‘….’) opener=urllib2.build_opener() feeddata=opener.open(request).read()
10、单元测试:unittest
以测试为核心开发策略的重要组成部分.
一个测试用例只回答一个问题。
每个测试用例必须和其他测试用例隔离工作。
11、动态导入模块:
>>> sys=__import__('sys') >>> sys <module 'sys' (built-in)>
12、性能优化:
使用timtit模块计时函数:
timeit.Timer(“soundex.soundex(‘Pilgrim’)”,“import soundex”)
#Timer类接受两个参数:第一个是要计时的语句,第二个是为第一个参数语句构建环境的导入语句。
t.timeit() # 默认调用函数一百万次返回的秒数
t.repeat(3,20000) #测试三次,调用被计时函数20000次。这也是默认值,都是可选的。
python性能优化的几个方面:
1、 在正则表达式和循环间选择,选择正则:正则是C语言编译,可以本能的在计算机上运行。循环以python编译,需要通过python解释器运行。
2、 在正则和字符串间选择,选择字符串:都是C编译的,字符串更简单。
3、 字典查找通常应用更快。如果python有定制方法可以用,使用它。