国内通行的是GBK
国际通行的是UTF-8
自动考试系统会因为有中文编码错误导致误判
encode()
默认是UTF-8编码
字符串常用函数
lower()小写
upper()大写
title()首字母大写
capitalize()第一个单词的第一个字母大写
swapcase()大小写互换
split()
split(sep,maxsplit)
splistlines()以\n为分割符
expandtabs()将\t补成空格,并且是补满一个制表,所以可以补个数不同的空格,这几个空格代表的还是\t
几个字符串的测试方法
isalnum()是否全是数字和字母组成
isalpha()是否全是字母组成
isdigit()是否全是数字组成
isiower()是否全是小写字母组成
isnumeric()是否全是数字组成
isspace()是否全是空白字符组成
istitle()是否全是首字母大写的单词组成
isupper()是否全是大写字母组成
isdecimal()是否全是十进制的字符组成
其中和测试数字有关的几个方法
isdigit()全数字 全角数字(双字节)唯一bytes数字(单字节)
isdecimal() 十进制字符 全角数字(双字节)
isnumeric() 十进制字符 全角数字(双数字) 唯一 罗马数字 唯一 汉字数字
没有一个支持小数点
- 全角:是一种电脑字符,是指一个全角字符占用两个标准字符(或两个半角字符)的位置。全角占两个字节。
汉字字符和规定了全角的英文字符及国标GB2312-80中的图形符号和特殊字符都是全角字符。在全角中,字母和数字等与汉字一样占据着等宽的位置。 - 半角:是指一个字符占用一个标准的字符位置。半角占一个字节。
半角就是 ASCII 方式的字符,在没有汉字输入法起作用的时候,输入的字母、数字和字符都是半角的