十进制 | 十六进制 | 控制字符 | 转义字符 | 说明 | Ctrl + 下列字母 |
---|
0 | 00 | NUL | \0 | Null character(空字符) | @ |
1 | 01 | SOH | | Start of Header(标题开始) | A |
2 | 02 | STX | | Start of Text(正文开始) | B |
3 | 03 | ETX | | End of Text(正文结束) | C |
4 | 04 | EOT | | End of Transmission(传输结束) | D |
5 | 05 | ENQ | | Enquiry(请求) | E |
6 | 06 | ACK | | Acknowledgment(收到通知/响应) | F |
7 | 07 | BEL | \a | Bell(响铃) | G |
8 | 08 | BS | \b | Backspace(退格) | H |
9 | 09 | HT | \t | Horizontal Tab(水平制表符) | I |
10 | 0A | LF | \n | Line feed(换行键) | J |
11 | 0B | VT | \v | Vertical Tab(垂直制表符) | K |
12 | 0C | FF | \f | Form feed(换页键) | L |
13 | 0D | CR | \r | Carriage return(回车键) | M |
14 | 0E | SO | | Shift Out(不用切换) | N |
15 | 0F | SI | | Shift In(启用切换) | O |
16 | 10 | DLE | | Data Link Escape(数据链路转义) | P |
17 | 11 | DC1 | | Device Control 1(设备控制1) /XON(Transmit On) | Q |
18 | 12 | DC2 | | Device Control 2(设备控制2) | R |
19 | 13 | DC3 | | Device Control 3(设备控制3) /XOFF(Transmit Off) | S |
20 | 14 | DC4 | | Device Control 4(设备控制4) | T |
21 | 15 | NAK | | Negative Acknowledgement(拒绝接收/无响应) | U |
22 | 16 | SYN | | Synchronous Idle(同步空闲) | V |
23 | 17 | ETB | | End of Trans the Block(传输块结束) | W |
24 | 18 | CAN | | Cancel(取消) | X |
25 | 19 | EM | | End of Medium(已到介质末端/介质存储已满) | Y |
26 | 1A | SUB | | Substitute(替补/替换) | Z |
27 | 1B | ESC | \e | Escape(溢出/逃离/取消) | [ |
28 | 1C | FS | | File Separator(文件分割符) | \ |
29 | 1D | GS | | Group Separator(分组符) | ] |
30 | 1E | RS | | Record Separator(记录分隔符) | ^ |
31 | 1F | US | | Unit Separator(单元分隔符) | _ |
32 | 20 | SP | | White space | [Space] |
127 | 7F | DEL | | Delete(删除) | ? |
以上的为控制字符,会影响文本的显示以及处理,必然在拷贝的时候会将出现此类字符之后的字符串截断
re.sub(ur'[\u0000-\u0020]','', line)
以上正则就是过滤控制字符,注意 \uxxxx要写出unicode的形式,也就是说必须要占4位,并且用16进制表示