本节使用的language.txt
文件来自于https://learnpythonthehardway.org/python3/languages.txt
。 输入和运行结果都没有问题,下面重点研究几个难理解的地方:
第一次接触这种格式的代码,方法都包含在函数中,主程序只是创建对象,然后运行这个主函数,主要逻辑和调用都在这个主函数里。
方法print_line
对一行字符串进行编码和解码。
主函数里首先拿出文件的一行,然后对这一行调用方法print_line
,最后调用自己达成循环,判断拿出文件的这一行是否是空字符串来决定退出循环。
计算机根本上是一个开关阵列,所有的东西用开关是否通电,即0和1决定。
unicode和utf8
string和bytes,DBES:解码字节串,编码字符串decode,encode
。
编码解码的参数errors :设置不同错误的处理方案。默认为 ‘strict’,意为编码错误引起一个UnicodeError。 其他可能得值有 ‘ignore’, ‘replace’, ‘xmlcharrefreplace’, ‘backslashreplace’ 以及通过 codecs.register_error() 注册的任何值。
破环程序
1、找一些别的编码方式的字符串,放到ex23.py
中。
使用utf16
和utf32
来编码字符串,其实就是在后面一直添加0而已。
2、使用不存在的编码方式
执行到语句encode的时候会显示不存在这个编码方式。
学习感悟:本节是真的有难度,不过肖哥在文中解释的很清楚,最后只有一个问题没有解决:就是破坏程序中的额外挑战,没有想到用字节串取代字符串的方法,因为文件保存的内容都是字符串,读出来也是字符串,怎么能在当成字节串用。这个问题后续在研究。