流:I/O
一、编码
编码
明文----->暗文
明文<-----暗文
解码
计算机只认识010101
ASCII (0-127)
ANSI (ASCII加上拉丁文)
GB2312 (ASCII加上7000多个汉字) 前八位和后八位 > 127
GBK (GB2312加上2万多个汉字) 前八位>127
UNICODE (国际通用)
UTF-8 (推荐)
py2中string (str,unicode(u)) str + unicode 行 str + unicode = unicode => str-->unicode
py3中string (str,bytes(b)) str + bytes 不行
爬虫
二、I/O
I-input 输入 读取数据
O-output 输出 写入数据
open(file, mode=‘r’, buffering=None, encoding=None, errors=None, newline=None, closefd=True)
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文 件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存 在,创建新文件。
w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在, 创建新文件。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说, 新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。 也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时 会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。 如果该文件不存在,创建新文件用于读写。