urllib_cookie import urllib2, cookielibcookielib: 主要作用是为urllib提供一个可用于存储cookie信息的对象,通常和urllib2模块结合着使用,通过这个对象可以用于跟踪后续请求中的cookie信息,自动管理cookie信息,这样就不需要我们每次请求的时候,都单独的设置cookie信息了。1>创建一个用于跟踪cookie信息的对象cookie_ob...
tieba_class import urllib2, reclass Tools(object): remove_emement = re.compile(r'<.*?>', re.S) remove_space = re.compile(r' ', re.S) remove_n = re.compile(r'', re.S) replace_br = re.comp...
糗事百科class封装 import sqlite3, urllib2, re创建工具类,用于对爬取的结果进行过滤class DataTool(object): # 定义查找特殊字符的正则表达式 remove_n = re.compile(r'') # |表示或者 br = re.compile(r'<br>|<br/>') quot = r...
urllib模块 这两个模块是用于发起网络请求的基础模块 import urllib,urllib2urlopen(): 打开一个url地址,获取服务器端的响应。response = urllib2.urlopen('http://www.baidu.com')read()函数,用于读取响应的数据result = response.read()print(result)通过urlli...
正则表达式函数 import rere.match():是从目标字符串的开头位置匹配数据,仅限于开头位置,成功则返回match对象,反之,则返回None。re.search():从目标字符串的任意位置匹配数据,仅匹配成功一次返回,如果目标字符串有多个结果的话,也只能找到一个。pattern = re.compile('my')res1 = re.search(pattern, 'mylove'...
正则表达式 import re 正则表达式:是对字符串内容进行匹配查询的一种操作方式,通过预先定义一些特殊字符的组合,形成一种规则字符串,利用这些规则字符串对字符串中的某一些内容进行提取或查找。常见的正则表达式转义字符'''\d:匹配一个数字\w: 匹配一个数字或者字母.: 可以匹配某一个字符后跟的任意一个字符 a. a字符后面可以跟任意一个字符都可以匹配成功。 匹配到:ab ...
函数对象-闭包 Python一切皆对象,函数也可以看成是一个函数对象。函数将作为一个返回对象在另一个函数中返回。def calc(a, b): c = a + b return cres = calc(10, 20)print(res)一个内部的函数引用了外部函数的变量,这种语法结构就形成了闭包def calc_test(*args): def sum(): ...
student_sqlite_test修改版 coding:utf-8import sqlite3定义一个创建数据库文件并添加Student表的函数def create_db_and_table(cursor): # AUTOINCREMENT约束:表示该字段自动增长,一般用于INTEGER类型。 # UNIQUE约束:表示该字段值是唯一的。 # NOT NULL约束:表示该字段值不允许为空。 ...
class_sqlite coding:utf-8import sqlite3声明数据模型类,数据模型类中只包含属性,而不包含操作数据的函数。class Student(object): """ 数据模型类设置的属性需要和数据库中设置的字段保持一致。 """ def __init__(self, name, age, score, id=0): super...
sqlite3基本用法 coding:utf-8sqlite3是Python内置的一种轻量级数据库。 数据库是用于保存大量的、格式统一的数据,比如保存name, age, sex, score。数据库内部的结构是由多张表table构成,表中是由多个字段构成。数据库管理多张表,表管理多个数据。 ”’ 1.先连接到数据库文件; 2.进行数据的写入或读取; 3.关闭数据库; ”’ import sqli...
__slots__变量的用法 coding:utf-8_slots_主要是用于限制一个类的对象所能添加的属性有哪些。class People(object): """docstring for People""" # 以元组的形式,定义能添加的属性,除此之外的属性则不能添加。即对动态绑定的属性发挥作用,又能对__init__()函数中的属性添加发挥作用。 __slots__ = ('nam...
@property装饰器 coding:utf-8@property负责装饰一个实例方法,让其生成对应的setter和getter方法,调用时,可以直接使用对象名.函数名的这种类似于属性的调用方式。class People(object): # @property是将work函数声明成为一个getter函数,getter函数是进行取值的操作。 @property def work(se...
class_decorator coding:utf-8装饰器是以@开头,@结构称为语法糖,装饰器的作用主要是给现有的函数增加一些额外的功能。 @classmethod @staticmethod @propertyclass People(object): """docstring for People""" def __init__(self, name, age): s...
类的继承 coding:utf-8面向对象编程的三个基本特征:继承、多态、封装。函数只是封装的最基本单位,而类和对象则是属于更高级的封装方式,在类中封装属性用于保存数据,在类中封装函数用于操作数据,不同的功能和逻辑可以封装成不同的函数。继承中耦合性太强。继承的优势:父类和子类,可以更好的实现代码的重用。 1>子类通过继承父类,子类可以拥有父类的所有属性和函数,子类不需要重复声明;父类...
方法的重写 coding:utf-8子类重写父类的方法:1>完全重写,子类不继承父类的所有函数功能,将父类的函数直接进行覆盖; 2>部分重写,父类函数中的功能符合子类需求,但是还需要再新增一些功能。注意:1>子类重写父类的函数(方法)时,子类中定义的函数名必须和父类的函数名保持一致。 2>重写时,使用super()函数是部分重写;不使用super()函数是完全...
self对象 coding:utf-8class People(object): """docstring for People""" def __init__(self, name, age): self.name = name self.age = age print 'self = ',self def show(self)...
实例变量的权限 如何让类内部定义的一些属性,不被外部访问,给类内部的属性增加了私有权限设置。Python中设置私有变量(private),需要在变量前加__class People(object): """docstring for People""" def __init__(self, name, age, weight): self.__name = name ...
对象操作 coding:utf-8类变量:由类名调用的变量称为类变量。 实例变量:只有实例对象才能调用的变量,称为实例变量。对象的属性也可以称为实例变量。 实例变量是在函数内定义,类变量是在函数体外进行定义。class Employee(object): """docstring for Employee""" # 声明一个类变量,记录员工总人数 total_emp...
filter_sorted函数 coding:utf-8filter()函数是用于对一个序列进行过滤或者筛选的操作。 两个参数:1>函数,设置过滤内容的逻辑;2>序列,list/str都可以。过滤偶数和奇数功能def filter_function(number): # 返回True或者False return number %2 == 1该函数会将序列中的每一个元素传递到函数中...
JSON数据 coding:utf-8JSON: 是采用键值对的结构组成的一组数据,是一种比较轻量级的数据交换格式,主要用在服务器和前端之间的数据传递。 现在的服务器端多以返回JSON格式的数据为主。 JSON数据相对于其它格式的数据,数据量小,传输速度快,解析效率高,格式较为统一,解析起来比较方便。XML: 类似于HTML,属于文本标记性语言,也可以作为服务端和前端之间的数据交互格式,解析过程较为...