名称 | unicode编码 | 描述 |
---|---|---|
全角空格 | u{3000} | 输出为整数 12288 trim时不会过滤 |
LF: 换行(Line Feed) \n | \u{a} | 输出为整数 10 |
CR: 回车(Carriage Return) \r | \u{d} | 输出为整数 13 |
苹果系统下换行符是 \r,其content.trimmingCharacters(in: CharacterSet.whitespacesAndNewlines) 方法不会过滤\n。
3F 字符编码时,如果该编码方式的字符集中没有该字符,当把编码后的字节数据16位输出时, 就会显示为一排排的3F,参见 文本的编码方式整理
FEFF UTF-8+BOM 中的BOM,用于标识bigEndian还是littleEndian,文本编码时如果带bom,可以轻松识别它是不是utf-8,utf-16,utf-32。
vs 新建的文件默认不带bom的,因为+BOM有时会引起平台间数据解析的问题。
assii码表中0~31及127(共33个)是控制字符或通信专用字符,是非可打印字符,向网页传输时,如果不对它们进行转义会导致浏览器json解析失败,一般采用unicode编码,则页面显示时不需要解码。正常表单编辑一般碰不到这类字符,但如果内容是从word文件中导入或其他类似操作,则可能碰到这钟问题。