1、所有的字符与符号,均有其unicode码
2、utf-8, utf-16.。。。均为unicode码的存储实现
3、没有完全确定的方法可以判断一个已经存在的文本文件是采用哪种编码方式落盘的
4、chardet是内置的探测数据的模块
5、在一般的web框架中,对数据的处理python都是使用默认的编解码已经完成了。2.7使用ascii 3.5使用utf-8
6、编写业务处理时,一般均以字符串来作为操作对象,不会去操作unicode码
综合上面可以看出,对于可控的文本对象,我们在架构设计时,就应该将其规划好,便于后续实现的可移植。