类和对象
类
用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。类里可以有多个属性,也可以有多个方法。同时也有自己的字段。
- 创建
定义类语法:
class ClassName(base_class[es]):
"optional documentation string"
static_member_declarations
method_declarations
方法 | 说明 |
---|---|
init(self,…) | 初始化对象,在创建新对象时调用 |
del(self) | 释放对象,在对象被删除之前调用 |
new(cls,*args,**kwd) | 实例的生成操作 |
str(self) | 使用print语句时被调用 |
getitem(self,key) | 获取序列的索引key对应的值,等价于seq[key] |
len(self) | 调用内联函数len()时被调用 |
getattr(s,name) | 获取属性的值 |
setattr(s,name,value) | 设置属性的值 |
delattr(s,name) | 删除name属性 |
- 继承
继承”可以使用现有类的所有功能,并在无需重新编写原来的类的情况下对这些功能进行扩展。通过继承创建的新类称为“子类”或“派生类”,被继承的类称为“基类”、“父类”或“超类”,继承的过程,就是从一般到特殊的过程。
继承类的构造方法:1.经典类的写法: 父类名称.init(self,参数1,参数2,…);2. 新式类的写法:super(子类,self).init(参数1,参数2,…)
子类对父类方法的重写:对基类/父类的方法进行修改时,可以采用talk()。 - 类型工厂
类型工厂函数实质上是类型转化函数:int(), long(), float(), complex(),str(), unicode(), basestring(),list(), tuple(),type(),dict(),bool(),set(), frozenset(),object(),classmethod(),staticmethod(),super(),property(),file()。
对象
在python中所有的东西都是对象,即能够被赋值到一个变量或作为一个参数传入一个函数。每个对象都有三个特性,身份(每一个对象都有一个唯一的身份标识自己,即该对象的内存地址,该地址可以用内建函数id()来获得)、类型(对象的类型决定了该对象可以保存什么样的数据,可以用内建函数type()来获得对象的类型,type()函数返回的是一个type类型的对象,而不是一个字符串)、值(对象表示的数据项)。
运算符 | 含义 |
---|---|
== | 两个对象在内存中的地址不同,只要值相同,就返回true |
is/is not | 对象本身的比较 |
and, or, not | 布尔逻辑运算符 |
object是所有类都继承的,是python的一个基类,但是type也是一个类型来的,而且object是的类型就是type,还有type也是自己的一个实例。python中class,即是类是通过type来生成的,而对象是通过类来生成的,即type --> class --> object。
正则表达式
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式的大致匹配过程是:1.依次拿出表达式和文本中的字符比较;2.如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败;3.如果表达式中有量词或边界,这个过程会稍微有一些不同。
符号 | 含义 |
---|---|
‘[’‘]’ | 字符集合设定符 |
“ | ” |
‘.’ | 匹配所有字符 |
‘^’ | 匹配字符串开头 |
’$’ | 匹配字符串结尾 |
‘/d’ | 匹配数字 |
‘/D’ | 匹配非数字 |
‘/w’ | 匹配字母和数字 |
‘/W’ | 匹配非英文字母和数字 |
‘/s’ | 匹配间隔符 |
‘/S’ | 匹配非间隔符 |
‘/A’ | 匹配字符串开头 |
‘/Z’ | 匹配字符串结尾 |
‘/b’ | 匹配单词边界 |
‘/B’ | 匹配非边界 |
‘*’ | 0 或多次匹配 |
‘+’ | 1 次或多次匹配 |
‘?’ | 0 或 1 次匹配 |
‘{m}’ | 精确匹配 m 次 |
‘{m,n}’ | 匹配最少 m 次,最多 n 次。 (n>m) |
- 注释
1.数量词的贪婪模式与非贪婪模式:正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字 符;非贪婪的则相反,总是尝试匹配尽可能少的字符。
2.反斜杠问题:正则表达式里使用”\”作为转义字符,这就可能造成反斜杠困扰。Python里的原生字符串很好地解决了这个问题,这个例子中的正则表达式可以使用r”\”表示。
re模块
函数 | 功能 |
---|---|
re.compile(pattern,flags=0) | 编译正则表达式模式,返回一个对象的模式 |
re.match(pattern, string, flags=0) | 决定RE是否在字符串刚开始的位置匹配 |
re.search(pattern, string, flags=0) | 在字符串内查找模式匹配,只要找到第一个匹配然后返回,如果字符串没有匹配,则返回None |
re.findall(pattern, string, flags=0) | 遍历匹配,可以获取字符串中所有匹配的字符串,返回一个列表 |
re.finditer(pattern, string, flags=0) | 搜索string,返回一个顺序访问每一个匹配结果(Match对象)的迭代器 |
re.split(pattern, string[, maxsplit]) | 按照能够匹配的子串将string分割后返回列表 |
re.sub(pattern, repl, string, count) | 使用re替换string中每一个匹配的子串后返回替换后的字符串 |
subn(pattern, repl, string, count=0, flags=0) | 返回替换次数 |
>>> re.match("c", "abcdef") # 不匹配
>>> re.search("c", "abcdef") # 匹配
prog = re.compile(pattern)
result = prog.match(string)
result = re.match(pattern, string)
>>> re.split('\W+', 'Words, words, words.')
['Words', 'words', 'words', '']
>>> re.split('(\W+)', 'Words, words, words.')
['Words', ', ', 'words', ', ', 'words', '.', '']
>>> re.split('\W+', 'Words, words, words.', 1)
['Words', 'words, words.']
http请求
HTTP 是一种请求/响应式的协议。一个客户机与服务器建立连接后,发送一个请求给服务器,请求的格式是:统一资源标识符(URI)、协议版本号,后面是类似 MIME 的信息,包括请求修饰符、客户机信息和可能的内容。服务器接到请求后,给予相应的响应信息,其格式是:一个状态行包括信息的协议版本号、一个成功或错误的代码,后面也是类似 MIME 的信息,包括服务器信息、实体信息和可能的内容。
方法库 | 用方式 |
---|---|
urllib2 | import urllib2;response = urllib2.urlopen(‘http://localhost:8080/jenkins/api/json?pretty=true’);print response.read() |
httplib | import httplib;conn = httplib.HTTPConnection(“www.python.org”);conn.request(“GET”, “/index.html”);r1 = conn.getresponse() |
requests | r = requests.post(“http://httpbin.org/post”, data=payload) |
- 方法
OPTIONS - 返回服务器针对特定资源所支持的HTTP请求方法。也可以利用向Web服务器发送’*'的请求来测试服务器的功能性。
HEAD - 向服务器索要与GET请求相一致的响应,只不过响应体将不会被返回。这一方法可以在不必传输整个响应内容的情况下,就可以获取包含在响应消息头中的元信息。
GET - 向特定的资源发出请求。注意:GET方法不应当被用于产生“副作用”的操作中,例如在web app.中。其中一个原因是GET可能会被网络蜘蛛等随意访问。
POST - 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。
PUT - 向指定资源位置上传其最新内容。
DELETE - 请求服务器删除Request-URI所标识的资源。
TRACE - 回显服务器收到的请求,主要用于测试或诊断。
CONNECT - HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。
PATCH - 用来将局部修改应用于某一资源,添加于规范RFC5789。