给自己看的笔记会比较乱,方便修改补充,学到哪块知识点就补充上去
部分内容的区别
python2 | python3 |
string.uppercase | string.ascii_uppercase |
string.lowercase | string.ascii_lowercase |
xrange | range |
from cStringIO import StringIO | from io import StringIO |
当需要写文件的时候 StringIO | BytesIO |
String模块
string模块主要包含关于字符串的处理函数
在例如获取随机密码等之类的题时可能会用到这些:
字符串常量
1.string.ascii_letters
获取所有ascii码中字母字符的字符串(包含大写和小写)
2.string.ascii_uppercase
获取所有ascii码中的大写英文字母
3.string.ascii_lowercase
获取所有ascii码中的小写英文字母
4.string.digits
获取所有的10进制数字字符
5.string.punctuation
获取所有的标点符号
6.printable
获取所有可以打印的字符
案例:(分析词频,针对小写字母和数字)
分析词频,针对所有可打印字符
大小写转换
1.upper()
将指定字符串变为大写
2.lower()
将指定字符串变为小写
3.title()
将给定的字符串中所有单词的首字母大写,其他全部小写
4.capitalize()
将给定的字符串中首字母大写,其他小写
5.swapcase()
将原字符串中的大写改为小写,小写改为大写
判断字符串
1.isdecimal()
判断给定字符串是否全为数字
是返回true,不是返回false
2.isalpha()
判断给定的字符串是否全为字母
3.isalnum()
判断给定的字符串是否只含有数字与字母
4.isupper()
判断给定的字符串是否全为大写,若包含数字字母全为大写也返回true
5.islower()
判断给定的字符串是否全为小写,若包含数字字母全为小写也返回true
6.istitle()
判断给定的字符串是否符合title() 字符串中所有单词的首字母大写,其他全部小写
7.isspace()
判断给定的字符串是否为空白符(空格、换行、制表符)
8.isprintable()
判断给定的字符串是否为可打印字符
9.isidentifier()
判断给定的字符串是否符合命名规则(只能是字母或下划线开头、不能包含除数字、字母和下划线以外的任意字符)
10.startswith('xxxxxx')
判断字符串以'xxxxxx'开头
11.endswith('xxxx')
判读字符串以'xxxx'结尾
注:不仅可以输入子字符串,还可以输入元组,若为元组时候只要有一个成真即为True
说道字符串,那么一定离不开ASCII码:
ASCII控制字符(不可打印的字符)
二进制 | 十进制 | 十六进制 | 缩写 | 可以显示的表示法 | 名称/意义 |
---|---|---|---|---|---|
0000 0000 | 0 | 00 | NUL | ␀ | 空字符(Null) |
0000 0001 | 1 | 01 | SOH | ␁ | 标题开始 |
0000 0010 | 2 | 02 | STX | ␂ | 本文开始 |
0000 0011 | 3 | 03 | ETX | ␃ | 本文结束 |
0000 0100 | 4 | 04 | EOT | ␄ | 传输结束 |
0000 0101 | 5 | 05 | ENQ | ␅ | 请求 |
0000 0110 | 6 | 06 | ACK | ␆ | 确认回应 |
0000 0111 | 7 | 07 | BEL | ␇ | 响铃 |
0000 1000 | 8 | 08 | BS | ␈ | 退格 |
0000 1001 | 9 | 09 | HT | ␉ | 水平定位符号 |
0000 1010 | 10 | 0A | LF | ␊ | 换行键 |
0000 1011 | 11 | 0B | VT | ␋ | 垂直定位符号 |
0000 1100 | 12 | 0C | FF | ␌ | 换页键 |
0000 1101 | 13 | 0D | CR | ␍ | 归位键 |
0000 1110 | 14 | 0E | SO | ␎ | 取消变换(Shift out) |
0000 1111 | 15 | 0F | SI | ␏ | 启用变换(Shift in) |
0001 0000 | 16 | 10 | DLE | ␐ | 跳出数据通讯 |
0001 0001 | 17 | 11 | DC1 | ␑ | 设备控制一(XON 启用软件速度控制) |
0001 0010 | 18 | 12 | DC2 | ␒ | 设备控制二 |
0001 0011 | 19 | 13 | DC3 | ␓ | 设备控制三(XOFF 停用软件速度控制) |
0001 0100 | 20 | 14 | DC4 | ␔ | 设备控制四 |
0001 0101 | 21 | 15 | NAK | ␕ | 确认失败回应 |
0001 0110 | 22 | 16 | SYN | ␖ | 同步用暂停 |
0001 0111 | 23 | 17 | ETB | ␗ | 区块传输结束 |
0001 1000 | 24 | 18 | CAN | ␘ | 取消 |
0001 1001 | 25 | 19 | EM | ␙ | 连接介质中断 |
0001 1010 | 26 | 1A | SUB | ␚ | 替换 |
0001 1011 | 27 | 1B | ESC | ␛ | 跳出 |
0001 1100 | 28 | 1C | FS | ␜ | 文件分割符 |
0001 1101 | 29 | 1D | GS | ␝ | 组群分隔符 |
0001 1110 | 30 | 1E | RS | ␞ | 记录分隔符 |
0001 1111 | 31 | 1F | US | ␟ | 单元分隔符 |
0111 1111 | 127 | 7F | DEL | ␡ | 删除 |
ASCII可显示字符(可打印的字符)
|
|
|
=====================================================================================
扩展ASCII
https://blog.csdn.net/na_tion/article/details/50148883
后128个称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展ASCII码允许将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。
十进制 DEC | 八进制 OCT | 十六进制 HEX | 二进制 BIN | 符号 Symbol | HTML 实体编码 | 中文解释 Description |
---|---|---|---|---|---|---|
128 | 200 | 80 | 10000000 | € | € | 欧盟符号 |
129 | 201 | 81 | 10000001 | |||
130 | 202 | 82 | 10000010 | ‚ | ‚ | 单低 9 引号 |
131 | 203 | 83 | 10000011 | ƒ | ƒ | 带钩的 拉丁小写字母f |
132 | 204 | 84 | 10000100 | „ | „ | 双低 9 引号 |
133 | 205 | 85 | 10000101 | … | … | 水平省略号 |
134 | 206 | 86 | 10000110 | † | † | 剑号 |
135 | 207 | 87 | 10000111 | ‡ | ‡ | 双剑号 |
136 | 210 | 88 | 10001000 | ˆ | ˆ | 修正字符 抑扬音符号 |
137 | 211 | 89 | 10001001 | ‰ | ‰ | 千分号 |
138 | 212 | 8A | 10001010 | Š | Š | 带弯音号的 拉丁大写字母 S |
139 | 213 | 8B | 10001011 | ‹ | ‹ | 左单书名号 |
140 | 214 | 8C | 10001100 | Œ | Œ | 拉丁大写组合 OE |
141 | 215 | 8D | 10001101 | |||
142 | 216 | 8E | 10001110 | Ž | Ž | 带弯音号的 拉丁大写字母 z |
143 | 217 | 8F | 10001111 | |||
144 | 220 | 90 | 10010000 | |||
145 | 221 | 91 | 10010001 | ‘ | ‘ | 左单引号 |
146 | 222 | 92 | 10010010 | ’ | ’ | 右单引号 |
147 | 223 | 93 | 10010011 | “ | “ | 左双引号 |
148 | 224 | 94 | 10010100 | ” | ” | 右双引号 |
149 | 225 | 95 | 10010101 | • | • | |
150 | 226 | 96 | 10010110 | – | – | 半长破折号 |
151 | 227 | 97 | 10010111 | — | — | 全长破折号 |
152 | 230 | 98 | 10011000 | ˜ | ˜ | 小波浪线 |
153 | 231 | 99 | 10011001 | ™ | ™ | |
154 | 232 | 9A | 10011010 | š | š | 带弯音号的 拉丁小写字母 s |
155 | 233 | 9B | 10011011 | › | › | 右单书名号 |
156 | 234 | 9C | 10011100 | œ | œ | 拉丁小写组合 oe |
157 | 235 | 9D | 10011101 | |||
158 | 236 | 9E | 10011110 | ž | ž | 带弯音号的 拉丁小写字母 z |
159 | 237 | 9F | 10011111 | Ÿ | Ÿ | 带弯音号的 拉丁大写字母 Y |
160 | 240 | A0 | 10100000 |   | ||
161 | 241 | A1 | 10100001 | ¡ | ¡ | 反向感叹号 |
162 | 242 | A2 | 10100010 | ¢ | ¢ | 分币符号 |
163 | 243 | A3 | 10100011 | £ | £ | 英磅符号 |
164 | 244 | A4 | 10100100 | ¤ | ¤ | |
165 | 245 | A5 | 10100101 | ¥ | ¥ | 人民币符号 |
166 | 246 | A6 | 10100110 | ¦ | ¦ | |
167 | 247 | A7 | 10100111 | § | § | 章节符号 |
168 | 250 | A8 | 10101000 | ¨ | ¨ | 通用货币符号 |
169 | 251 | A9 | 10101001 | © | © | 版权符号 |
170 | 252 | AA | 10101010 | ª | ª | 阴性顺序 指示符号 |
171 | 253 | AB | 10101011 | « | « | 左角引号 |
172 | 254 | AC | 10101100 | ¬ | ¬ | |
173 | 255 | AD | 10101101 | | ­ | |
174 | 256 | AE | 10101110 | ® | ® | |
175 | 257 | AF | 10101111 | ¯ | ¯ | |
176 | 260 | B0 | 10110000 | ° | ° | 温度符号 |
177 | 261 | B1 | 10110001 | ± | ± | 加/减号 |
178 | 262 | B2 | 10110010 | ² | ² | 上标 2 |
179 | 263 | B3 | 10110011 | ³ | ³ | 上标 3 |
180 | 264 | B4 | 10110100 | ´ | ´ | |
181 | 265 | B5 | 10110101 | µ | µ | 微符号 |
182 | 266 | B6 | 10110110 | ¶ | ¶ | 段落符号, pilcrow |
183 | 267 | B7 | 10110111 | · | · | 中点 |
184 | 270 | B8 | 10111000 | ¸ | ¸ | |
185 | 271 | B9 | 10111001 | ¹ | ¹ | 上标 1 |
186 | 272 | BA | 10111010 | º | º | 阳性顺序 指示符 |
187 | 273 | BB | 10111011 | » | » | 右角引号 |
188 | 274 | BC | 10111100 | ¼ | ¼ | 分数四分之一 |
189 | 275 | BD | 10111101 | ½ | ½ | 分数二分之一 |
190 | 276 | BE | 10111110 | ¾ | ¾ | |
191 | 277 | BF | 10111111 | ¿ | ¿ | 反向问号 |
192 | 300 | C0 | 11000000 | À | À | 带重音符 的大写字母 A |
193 | 301 | C1 | 11000001 | Á | Á | 带尖锐重音 的大写字母 A |
194 | 302 | C2 | 11000010 | Â | Â | 带音调符号 的大写字母 A |
195 | 303 | C3 | 11000011 | Ã | Ã | 带代字号 的大写字母 A |
196 | 304 | C4 | 11000100 | Ä | Ä | 带元音变音 (分音符号) 的大写字母 A |
197 | 305 | C5 | 11000101 | Å | Å | 带铃声 的大写字母 A |
198 | 306 | C6 | 11000110 | Æ | Æ | 大写字母 AE 双重元音 |
199 | 307 | C7 | 11000111 | Ç | Ç | 带变音符号 的大写字母 C |
200 | 310 | C8 | 11001000 | È | È | 带重音符 的大写字母 E |
201 | 311 | C9 | 11001001 | É | É | 带尖锐重音 的大写字母 E |
202 | 312 | CA | 11001010 | Ê | Ê | 带音调符号 的大写字母 E |
203 | 313 | CB | 11001011 | Ë | Ë | 带元音变音 (分音符号) 的大写字母 E |
204 | 314 | CC | 11001100 | Ì | Ì | 带重音符 的大写字母 I |
205 | 315 | CD | 11001101 | Í | Í | 带尖锐重音 的大写字母 I |
206 | 316 | CE | 11001110 | Î | Î | 带音调符号 的大写字母 I |
207 | 317 | CF | 11001111 | Ï | Ï | 带元音变音 (分音符号) 的大写字母 I |
208 | 320 | D0 | 11010000 | Ð | Ð | |
209 | 321 | D1 | 11010001 | Ñ | Ñ | 带代字号 的大写字母 N |
210 | 322 | D2 | 11010010 | Ò | Ò | 带重音符 的大写字母 O |
211 | 323 | D3 | 11010011 | Ó | Ó | 带尖锐重音 的大写字母 O |
212 | 324 | D4 | 11010100 | Ô | Ô | 带音调符号 的大写字母 O |
213 | 325 | D5 | 11010101 | Õ | Õ | 带代字号 的大写字母 O |
214 | 326 | D6 | 11010110 | Ö | Ö | 带元音变音 (分音符号) 的大写字母 O |
215 | 327 | D7 | 11010111 | × | × | 大写字母 OE 连字 |
216 | 330 | D8 | 11011000 | Ø | Ø | 带斜杠 的大写字母 O |
217 | 331 | D9 | 11011001 | Ù | Ù | 带重音符 的大写字母 U |
218 | 332 | DA | 11011010 | Ú | Ú | 带尖锐重音 的大写字母 U |
219 | 333 | DB | 11011011 | Û | Û | 带音调符号 的大写字母 U |
220 | 334 | DC | 11011100 | Ü | Ü | 带元音变音 (分音符号) 的大写字母 U |
221 | 335 | DD | 11011101 | Ý | Ý | 带元音变音 (分音符号) 的大写字母 Y |
222 | 336 | DE | 11011110 | Þ | Þ | |
223 | 337 | DF | 11011111 | ß | ß | 德语高调 小写字母 s |
224 | 340 | E0 | 11100000 | à | à | 带重音符 的小写字母 a |
225 | 341 | E1 | 11100001 | á | á | 带尖锐重音 的小写字母 a |
226 | 342 | E2 | 11100010 | â | â | 带音调符号 的小写字母 a |
227 | 343 | E3 | 11100011 | ã | ã | 带代字号 的小写字母 a |
228 | 344 | E4 | 11100100 | ä | ä | 带元音变音 (分音符号) 的小写字母 a |
229 | 345 | E5 | 11100101 | å | å | 带铃声的 小写字母 a |
230 | 346 | E6 | 11100110 | æ | æ | 小写字母 ae 双重元音 |
231 | 347 | E7 | 11100111 | ç | ç | 带变音符号 的小写字母 c |
232 | 350 | E8 | 11101000 | è | è | 带重音符 的小写字母 e |
233 | 351 | E9 | 11101001 | é | é | 带尖锐重音 的小写字母 e |
234 | 352 | EA | 11101010 | ê | ê | 带音调符号 的小写字母 e |
235 | 353 | EB | 11101011 | ë | ë | 带元音变音 (分音符号) 的小写字母 e |
236 | 354 | EC | 11101100 | ì | ì | 带重音符 的小写字母 i |
237 | 355 | ED | 11101101 | í | í | 带尖锐重音 的小写字母 i |
238 | 356 | EE | 11101110 | î | î | 带音调符号 的小写字母 i |
239 | 357 | EF | 11101111 | ï | ï | 带元音变音 (分音符号) 的小写字母 i |
240 | 360 | F0 | 11110000 | ð | ð | |
241 | 361 | F1 | 11110001 | ñ | ñ | 带代字号 的小写字母 n |
242 | 362 | F2 | 11110010 | ò | ò | 带重音符 的小写字母 o |
243 | 363 | F3 | 11110011 | ó | ó | 带尖锐重音 的小写字母 o |
244 | 364 | F4 | 11110100 | ô | ô | 带音调符号 的小写字母 o |
245 | 365 | F5 | 11110101 | õ | õ | 带代字号 的小写字母 o |
246 | 366 | F6 | 11110110 | ö | ö | 带元音变音 (分音符号) 的小写字母 o |
247 | 367 | F7 | 11110111 | ÷ | ÷ | 小写字母 oe 连字 |
248 | 370 | F8 | 11111000 | ø | ø | 带斜杠 的小写字母 o |
249 | 371 | F9 | 11111001 | ù | ù | 带重音符 的小写字母 u |
250 | 372 | FA | 11111010 | ú | ú | 带尖锐重音 的小写字母 u |
251 | 373 | FB | 11111011 | û | û | 带音调符号 的小写字母 u |
252 | 374 | FC | 11111100 | ü | ü | 带元音变音 (分音符号) 的小写字母 u |
253 | 375 | FD | 11111101 | ý | ý | 带元音变音 (分音符号) 的小写字母 y2 |
254 | 376 | FE | 11111110 | þ | þ | |
255 | 377 | FF | 11111111 | ÿ | ÿ |