忽然笑
根据收到的评论,我对此进行了进一步的研究。目前看来,最佳做法是放弃使用HTML实体,而改用实际的UTF-8字符。列出的原因如下:对于那些了解字符含义并知道如何键入字符的人来说,UTF-8编码更易于阅读和编辑。对于不了解UTF-8编码的人来说,UTF-8编码与HTML实体编码一样难以理解,但是它们具有呈现为特殊字符的优势,而不是难以理解的十进制或十六进制编码。只要页面的编码正确设置为UTF-8,就应该使用实际字符而不是HTML实体。我阅读了一些有关此主题的文档,但最有帮助的是:UTF-8:字符编码的秘密维基百科特殊字符帮助从UTF-8:字符编码的秘密文章:对于最初使用ISO-8859-1的应用程序来说,Wikipedia是一个很好的案例研究,但是当它变得太笨拙而无法支持外语时,便切换到UTF-8。Bot现在实际上将浏览文章并将字符实体转换为相应的真实字符,以便于用户友好和可搜索。那篇文章还给出了一个很好的例子,涉及中文编码。这是出于懒惰的缩写示例:UTF-8:這兩個字是甚麼意思HTML实体:這兩個字是甚麼意思UTF-8和HTML实体编码对我来说都是没有意义的,但至少UTF-8编码可以识别为外语,并且可以在编辑框中正确呈现。本文继续对HTML实体编码版本说以下内容:对于我们当中那些真正知道角色实体是什么的人来说,这极为不便,而对于那些不知道这些角色的贫困用户来说,这是完全不明白的!甚至是稍微更人性化,“难以理解”的字符实体,例如θ。会让对学习HTML不感兴趣的用户挠头。另一方面,如果他们在编辑框中看到θ,他们将知道这是一个特殊字符,并对其进行相应处理,即使他们自己不知道如何编写该字符也是如此。正如其他人指出的那样,对于保留的XML字符(与号,小于号,大于号),您仍然必须使用HTML实体。