(1)文件操作
文件操作模式
w以写方式打开文件,可向文件写入信息。如文件存在,则清空该文件,再写入新内容
a以追加模式打开文件(即一打开文件,文件指针自动移到文件末尾),如果 文件不存在则创建
r+以读写方式打开文件,可对文件进行读和写操作。
w+消除文件内容,然后以读写方式打开文件。
a+以读写方式打开文件,并把文件指针移到文件尾。
b以二进制模式打开文件,而不是以文本模式。
该模式只对Windows或Dos有效,类Unix的文件是用二进制模式进行操作的。
读文件
写文件
(2)Python操作时间
时间类型转换
将date类型转化成固定的字符串
将字符串转化成date类型
对时间进行加减操作
(3)collections集合增强
Namedtuple
能够tuple的每个元素起个名字
基于tuple的扩展,tuple一旦被创建无法修改,获取tuple中的数据,只能通过叫标值进行获取。
知道角标0对应是什么值,不知道的话就很烦。
Deque
相当于java中的linkedlist,特性:查询慢,删除修改快。
Ordereddict
可以排序的字典,按照插入顺序排序。
Counter
内置计数器
(4)urllib 获取服务器的资源
自定义爬虫的的重要组件
获取百度首页的资源