国际化开发技术FAQ

什么是国际化开发?

答:指应用程序能够支持不同的语言输入和显示,同时也能够自如的适应不同文化的习俗。

 

字节、字符、字符集和字符集编码的关系?

答:计算机底层处理的最小单位是字节(8 位二进制表示)。

字符是表示一个有意义的符号或文字。

字符集是由一组相关的字符所组成的集合。比如说德文字符集只与德文相关,中文字符集只与中文相关,不会互相包含。

字符集编码是解决字符在计算机中的编码问题。

 

如何将字符集进行分类?

答:字符集编码通常可以分为以下3 种:单字节编码、宽字符编码和多字节字符编码。

    按照c/c++ 习惯,还可以分为:ANSI 字符集(单个/0 字符结尾)和宽字符集。

 

什么是 gb2312 字符集?

答:由原中国国家标准总局发布,198151 日实施,是中国国家标准的简体中文字符集。它收录了汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共7445 个图形字符。

 

什么是 gbk 字符集?

答:GBK 最初是由微软对GB2312 的扩展,也就是CP936 字码表 (Code Page 936) 的扩展(原来的CP936GB 2312-80 一模一样),最初出现于Windows 95 简体中文版中,由于Windows 产品的流行和在大陆广泛被使用,中华人民共和国国家有关部门将其作为技术规范。注意GBK 并非国家正式标准,只是国家技术监督局标准化司、电子工业部科技与质量监督司发布的“技术规范指导性文件”。虽然 GBK 收录了所有Unicode 1.1GB 13000.1-93 之中的汉字,但是编码方式与Unicode 1.1GB 13000.1-93 不同。仅仅是GB 2312GB 13000.1-93 之间的过渡方案。GBK 收录了21886 个符号,它分为汉字区和图形符号区。汉字区包括21003 个字符。

 

什么是 GB18030 字符集?

答: 2000 年的GB18030 取代了GBK1.0 的正式国家标准。该标准收录了27484 个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC 平台必须支持GB18030 ,对嵌入式产品暂不作要求。所以手机、MP3 一般只支持GB2312

 

什么是 BIG5 字符集?

答: 大五码(Big5 ),又称为五大码,是使用繁体 中文社群中最常用的电脑汉字字符 标 准,共收录13,060 个中文字,其中有二字为重覆编码,Big5 属中文内码(中文码分为中文内码及中文交换码两类)。Big5 虽普及于台湾、香港与澳门 等繁体中文通行区,但长期以来并非当地的国家标准,而只是业界标准(de facto standard )。倚天中文系统、Windows 等主要系统的字符集都是以Big5 为基准,但厂商又各自增删,衍生成多种不同版本。

    2003 年,Big5 被收录到台湾官方标准的附录当中,取得了较正式的地位。这个最新版本被称为Big5-2003

 

什么是 许盖功 ”问题?如何解决?

答:Big5 是双字节字符集,使用了双 字符 储存方法,以两个字节来安放一个字。第一个字节称为「高位字节」,第二个字节称为「低位字节」。 高位字节 使用了0x81-0xFE 低位字节 使用了0x40-0x7E ,及0xA1-0xFE

Big5 的分区中:

0x8140-0xA0FE

保留给使用者自定义字元(造字区)

0xA140-0xA3BF

标点符号、希腊字母 及特殊符号,
包括在0xA259-0xA261 ,安放了双音节 度量衡 单位用字:-( 兙兛兞兝兡兣嗧瓩糎)-

0xA3C0-0xA3FE

保留。此区没有开放作造字区用。

0xA440-0xC67E

常用汉字,先按笔划 再按部首 排序。

0xC6A1-0xC8FE

保留给使用者自定义字元(造字区)

0xC940-0xF9D5

次常用汉字,亦是先按笔划再按部首排序。

0xF9D6-0xFEFE

保留给使用者自定义字元(造字区)

    如其他DBCS 字符集相同,普通ASCII (小于0x80 )采用一个字节表示,这与双字节的低字节部分有重叠。

    因为低位 字符 中包含了程序 shellscript 中,字串或命令常会用到的特殊字元,例如0x5C “/”0x7C “|” 等。「/ 」 在许多用途的字串中是当作转义符号又称为跳脱 字符 ,例如 /n (换行)、/r (归位)/ttab )、/// 本身符号)、/" (引号)等等。而 「| 」 在UNIX 作业系统中大多当作命令管线的使用,如 "ls -la | more" 等等。如果在字串中有这些特殊的转义字元,会被程序或编译器解释为特殊用途。但是因为是中文的原因,故无法正确解释为上面所述的行为,因此程式可能会忽略此转义符号或是中断执行。若此,就违反了使用者本来要当成中文字元一部份使用的本意。

    在常用字如「功」(0xA55C) 、「-()-(0xB35C) 、「盖」(0xBB5C) 、「育」(0xA87C) 中时常出现,造成了许多软体无法正确处理以Big5 编码的字串或文件。这个问题被戏谑性地人名化,称为「-( 许功盖)- 」或「-( 许盖功)- ( 这三个字都有这种问题)

    一般的解决方法,是额外增加“/” 的字元,因为“//” 会被解释为“/” ,所以 成功/ 因素 这个字串就能无误地被程式当作 成功因素 的字串来处理。 但是额外的困扰是,有些输出功能并不会把“/” 当作特殊字元看待,所以有些程式或网页就会错误地常常出现在「许功盖」这些字后面多了“/”

 

什么是 HKSCS 字符集?

答:HKSCS 是中国香港增补字符集,是以big5 为基础进行扩充的。增加了一些粤语方言字和地名等。

 

什么是 UTF-8 字符集?

答:UTF-88 位元 Universal Character Set Unicode Transformation Format )是一种针对 Unicode 的可变长度字符编码 。它可以用来表示 Unicode 标准中的任何字符,且其编码中的第一个字节 仍与 ASCII 相容,这使得原来处理 ASCII 字符的软件 无须或只须做少部份修改,即可继续使用。因此,它逐渐成为电子邮件 网页 及其他储存 或传送文字的应用中,优先采用的编码。

 

什么是 UTF-16 字符集?

答: UTF-16 unicode 的缺省编码方式,不兼容ASCII 码,所有字符都是占用两个字节。存在大小端的问题,一般用于本地存储和显示。

 

什么是 UTF-32 字符集?

答: UTF-32 一般用于UCS-4 ,采用4 字节编码方式,目前很少用到。UTF-32UTF-16 一样存在大小端的问题。

什么是 BOM

答: Unicode 规范中推荐的标记字节顺序的方法是BOMBOM 不是“Bill Of Material”BOM 表,而是Byte Order MarkBOM 是一个有点小聪明的想法:

UCS 编码中有一个叫做”ZERO WIDTH NO-BREAK SPACE” 的字符,它的编码是FEFF 。而FFFEUCS 中是不存在的字符,所以不应该出现在实际传输中。UCS 规范建议我们在传输字节流前,先传输 字符”ZERO WIDTH NO-BREAK SPACE”

这样如果接收者收到FEFF ,就表明这个字节流是Big-Endian 的;如果收到FFFE ,就表明这个字节流是Little-Endian 的。因此字符”ZERO WIDTH NO-BREAK SPACE” 又被称作BOM

UTF-8 不需要BOM 来表明字节顺序,但可以用BOM 来表明编码方式。字符”ZERO WIDTH NO-BREAK SPACE”UTF-8 编码是EF BB BF 。所以如果接收者收到以EF BB BF 开头的字节流,就知道这是UTF-8 编码了。

 

记事本、 UltraEdit VIM BOM 支持情况如何

答:记事本可以自动识别带不带BOM 的文本文件。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SemCms是一套开源外贸企业网站管理系统,主要用于外贸企业,兼容IE、Firefox 、google、360 等主流浏览器。 SemCms(asp版)使用vbscript语言编写,结合iis运行。 SemCms(php版)使用php语言编写,结合apache,在window,或linux系统下运行。 SemCms采用国际通用utf-8编码编写。 SemCms非常适合在外贸企业,电子商务互联网应用上使用,2009年12月首次发布以来,SemCms依靠出色的用户体验和领先的技术不断扩大外贸场占有率,目前在国内已经成为最受欢迎的英文外贸网站之一。 主要特点: 快速:体积小,加载速度快。 开源:开放源代码,高水平,高品质。 扩展:可静态化,可根据需求增减功能。 风格:修改编辑风格很容易,只需修改一个CSS文件。 兼容:支持大部分主流浏览器,比如IE、Firefox google、360 等。 程序php版 : php+myslq+apache+div+css。php版采用自适应网站模式开发,兼容pc端、移动和平板端设备。 主要功能: 主要栏目:Home About us Products News FAQ Feedback Contact us。 文件名:自定义产品文件名,产品栏目文件名,上传的图片文件名。 生成静态:semcms:asp版可生成整站纯静态html格式(一键生成方式),php版可全站伪静态使用 url 重写机制。 缩略图:上传图片结合aspjpeg组件可生成大图与小图及自定义水印位置,无限制上传图片。 图片展示:结合lightbox插件多图展示。 询盘管理:客户留言及询盘都可自动发送自已定义的邮箱及后台的询盘管理中。 联系方式:无限制添加emial,skype,WhatsApp可自行输入。 模板管理:后台模板一键切换。 文件管理:图片与文件可一键删除。 排序功能:导航,产品,栏目,可自定义排序,随意调动显示顺序。 后台管理:所有参数都在后台自行设定。 系统扩展: semcms php版 可扩展 多语言系统,商城模式。 运行环境: php+mysql+apache windows系统或linux系统下运行 默认帐户密码: 后台帐户:Admin 后台密码:1 semcms php 版 外贸网站 V1.6更新内容如下: 1.修改上传文件,获取扩展名 2.修改带单引号的数据写不了数据库 3.友情链接修改,用户修改,banner 等修改,为空返回链接地址不对
Django 2.2.2.dev20190508124537 文档 ========================== Django 文档 你所需要知道的关于 Django 的一切。 获取帮助 遇到问题?我们可以帮你! 试试 FAQ —— 这里有很多常见问题的解答。 正在寻找特定的信息?试试 索引,模块索引 或者 详细内容目录。 在 django-users 邮件列表的档案库搜索,或者 post a question。 在 #django IRC channel 频道提问 在我们的 ticket tracker 报告关于 Django 的 Bug。 这份文档是如何组织的 Django 有丰富的文档。一份高度概述的文档会告诉你在哪里找到特定的东西: 教程 通过手把手地方式教你一步步的创建一个 Web 应用。如果你初学 Django 或编程,请从这里开始。也请看看下面的 "快速入门"。 专题指南 在相当高的层次上介绍关键主题和概念,并提供有用的背景信息和解释。 参考指南 包含 API 和 Django 各个工作机制方面的技术参考。它们介绍了 Django 是如何工作,如何被使用的。不过,你得先对关键字的概念有一定理解。 操作指南 是一份目录。它们以排列好的关键问题和用例的方式指导你。它们比教程更加深入,且需要你先了解一些关于 Django 是如何工作的知识。 快速入门 您是刚学 Django 或是初学编程? 这就是你开始学习的地方! 从零开始: 概要 | 安装 入门教程: 第1节: 请求和响应 | 第2节: 模型和 admin 站点 | 第3节: 视图和模板 | 第4节: 表单和通用视图 | 第5节: 测试 | 第6节: 静态文件 | 第7节: 自定义 admin 站点 进阶教程 : 如何编写可复用的应用 | 提交你的第一个 Django 补丁 模型层 Django 提供了一个抽象的模型 ("models") 层,为了构建和操纵你的Web应用的数据。阅读下面内容了解更多: 模型: 模型介绍 | 字段类型 | 索引 | Meta 选项 | Model 类 QuerySet: 执行查询 | QuerySet 方法参考 | 查询表达式 Model 实例: 实例方法 | 访问关联的对象 迁移: 迁移概述 | 操作参考 | SchemaEditor | 编写迁移 高级: 管理员 | 原始 SQL | 事务 | 聚合 | 搜索 | 自定义字段 | 多个数据库 | 自定义查询 | 查询表达式 | 条件表达式 | 数据库函数 其它: 支持的数据库 | 旧数据库 | 提供初始化数据 | 优化数据库访问 | PostgreSQL 的特定功能 视图层 Django 具有 “视图” 的概念,负责处理用户的请求并返回响应。通过以下链接查找所有你需要知道的有关视图的信息: 基础: URL配置 | 视图函数 | 便捷工具 | 装饰器 参考: 内置视图 | Request/response 对象 | TemplateResponse 对象 文件上传: 概览 | 文件对象 | 存储 API | 管理文件 | 自定义存储 基于类的视图: 概览 | 内置显示视图 | 内置编辑视图 | 使用混入 | API 参考 | 扁平化索引 高级: 生成 CSV | 生成 PDF 中间件: 概览 | 内建的中间件类 模板层 模板层提供了一个对设计者友好的语法用于渲染向用户呈现的信息。学习如何使用语法(面向设计者)以及如何扩展(面向程序员): 基础: 概述 对于设计者: 语法概述 | 内建标签及过滤器(filters) | 人性化 针对程序员: 模板 API | 自定义标签(tags)和过滤器(filters) 表单 Django 提供了一个丰富的框架来帮助创建表单和处理表单数据。 基础: 概览 | 表单 API | 内建字段 | 内建 widgets 进阶: 针对模型的表单 | 整合媒体 | 表单集 | 自定义验证 开发进程 学习众多的组件及工具,来帮助你开发和测试 Django 应用: 设置: 概览 | 完整的设置列表 应用程序: 概览 异常: 概览 django-admin.py 和 manage.py: 概览 | 添加自定义命令 测试: 介绍 | 书写并运行测试 | 包含的测试工具 | 高级主题 部署: 概览 | WSGI 服务器 | 部署静态文件 | 用 email 跟踪代码错误 管理 找到所有你想知道的,关于自动化管理界面的知识,Django 最受欢迎的特性之一: 管理站点 管理动作 管理文档生成器 安全 在 Web 应用的发展中,安全是最重要主题,Django 提供了多种保护手段和机制。 安全概览 在 Django 中披露的安全问题 点击劫持保护

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值