DNS的查找机制、中文扩展,及其对手机扫描商标名称的支持
DNS的查找机制
当DNS查找主机时,它首先在本域里查找,如果找不到则交给更上一级的域查找,直至顶级的域。因此,如果计算机在北大域名(pku.edu.cn)下,查找会经过如下过程:
// 在mycomputer.pku.edu.cn计算机的浏览器的地址栏中敲入tsinghua
tsinghua -> tsinghua.pku.edu.cn (同域查找,未找到)
-> tsinghua.edu.cn (上一级域名查找,找到)
// 在mycomputer.pku.edu.cn计算机的浏览器的地址栏中敲入yahoo
yahoo -> yahoo.pku.edu.cn (同域查找,未找到)
-> yahoo.edu.cn (上一级域名查找,未找到)
-> yahoo.com.cn (其他顶级域名查找,未找到)
-> yahoo.com (找到)
需要说明,网址常带有www.
前缀。该前缀不代表主机名,而代表公开对外(World-Wide-Web“第三世界”)的内容。自己人浏览的网页内容与外人看到的内容是有区别的,这是互联网(Internet)无声的约定。内外之别的区分,也可以用DNS服务支持;比方说对内有pku.edu.cn主机,对外则只有www.pku.edu.cn主机。DNS匹配路径时,可以自动添加www.
前缀,例如:
// 在mycomputer.pku.edu.cn计算机的浏览器的地址栏中敲入yahoo
yahoo -> yahoo.pku.edu.cn (同域查找,未找到)
-> yahoo.edu.cn (上一级域名查找,未找到)
-> yahoo.com.cn (其他顶级域名查找,未找到)
-> www.yahoo.com (找到)
另外,顶级域名(如.com.cn
、.edu.cn
)本来代表物理上相互隔离的网络,例如校园网应当由各大学相互联接自行铺设,而独立于(时间上早于)商业网。另一方面,由于DNS服务按域逐级自动查找,因此使用更“平坦”的网址(如使用.cn
网址)是没有必要的。
DNS的注册机制
DNS中的域名注册实际上是注册在某一域之下,这有以下的引申含义:
首先,相同域名可以注册到不同的域下。如Yahoo可以同时注册yahoo.com
或yahoo.com.cn
。DNS总是试图在距离较近的域中找到匹配。(Yahoo的创始人之一是华裔杨致远,Yahoo首先是一个手工录入的层级的目录系统(暗示不同的人看到属于自己圈子的不同的内容),Yahoo曾是最热的门户网站。Yahoo于2013年退出中国市场,退出中国的部分原因是由于政府对内容的审查。而实际上中国缺少对隐私的基本保护,退出中国市场是按西方标准实在“不好意思”再做下去了(从某个角度来看是助长恶习)。Yahoo中国的剩余部分卖给了阿里巴巴,后者是交易中介,却对搜索技术情有独钟。)
第二,某一域名可以仅对域内可见,对外不可见。例如前面所述的无www.
前缀的地址,可以不对外公开。
域、或者内外之别,是互联网的基础概念。由于内外之别,搜索引擎服务需要建立在域之上(这也有助于更专业的搜索技术,如自然语言搜索的研发与尝试)。但是,还有一个同样至关重要的原则,那就是网页的内容是确定性的(fact-book),政府或网络服务商不得更改、过滤网页内容,这就象不能更改朋友之间或者商家客户之间往来的信函一样。
作为题外话,应当禁止(或者用户应当抵制)针对性的广告服务,禁止搜索引擎与网站过度搜集与分享个人隐私。就象选择杂志一样,用户应当找到自己喜欢的免费或者付费的网站;而网站也应当有专业性、只服务于特定的人群(我们的网站正好相反);因此针对性的广告是不必要的。英文版的计算机书籍,有一个系列叫“The definitive guide to …”,象是暗示中国人在计算机领域的偏好是对自己的“定义”(也可能在笑话中国人的技术文档和书籍从不解释清楚)。不过,中国人缺少隐私感是自己的事,西方不会好心到要求禁止。
中文域名的映射
DNS应当能扩展支持中文域名,例如:
北京大学.edu.cn == pku.edu.cn
北大.edu.cn == pku.edu.cn
中国语言文学系.北大.edu.cn == chinese.pku.edu.cn
中文系.北大.edu.cn == chinese.pku.edu.cn
如果让DNS支持拆开按中国习惯由大到小连在一起的中文路径,并且省略顶级的域名,那么:
北大中文系 == chinese.pku -> chinese.pku.edu.cn
北京大学中文系 == chinese.pku -> chinese.pku.edu.cn
// 在北大网域内
中国语言文学系 == chinese -> chinese.pku.edu.cn
中文系 == chinese -> chinese.pku.edu.cn
这样,无标点的“中文实名”就可以用来代表网址。可能存在路径拆分冲突的问题,但浏览器可让用户从匹配中选择,用户也总是可以用“.”显式输入路径。
使用中文域名的一个好处是用英文、拼音或者它们的缩写来写的路径难以记忆,如国家图书馆(www.nlc.gov.cn)、与首都图书馆(www.clcn.net.cn)。
中文实名也应支持电子邮件,将拼音用作邮件名字并不方便,且在新浪邮箱等注册时总是发现拼音拼写已被占用。不过,电子邮件服务(SMTP)与DNS并不是同一个服务。按惯例,电子邮件地址应当用“@”,在域内可以省略该域的路径后缀。另外,个人主页(homepage)与邮件地址有对应关系。
胡适@北京大学 -> 胡适@pku.edu.cn
-> 主页: http://www.pku.edu.cn/~胡适 (对外)
http://pku.edu.cn/~胡适 (对内)
// 如果在北大校园网内
胡适@中文系 == 胡适@chinese -> 胡适@chinese.pku.edu.cn
与个人主页相比,博客格式固定,没有交流分享的圈内感,但提供了基本的文档分类管理功能。操作系统应能提供简单方便的工具,用几行代码轻松实现类似博客目录的网页生成。
由于中文域名网址都能转化为英文规范网址(canonical name),因此,当向其他不支持中文扩展的域传递网址时,可先作转换。同理,如果注册中文Email名时也同时注册英文规范名,那么,该Email地址也能在不支持中文扩展的外域使用。
用域名代替二维码并支持手机扫描
二维码常用来方便手机快速访问网站链接。由于二维码服务由统一的运营商提供,每次扫描都需要经过该运营商,因此,该运营商会过度收集隐私,这应被国家与地方政府禁止。DNS服务则有域的划分。
值得一提的是,我没有在网上看到关于二维码服务的清晰的技术性说明文档。理解原理是参与和作出贡献的基础,无论是技术、还是国家政策都是如此。
另一方面,汉字是完美的二维码。汉字商标通常字数较少,如“支付宝”、“一卡通”。如果手机有基本的汉字识别能力,就可以扫描汉字域名,自动跳转到相关网页。例如,如果www.alipay.com
也注册为www.支付宝.com
,那么,“支付宝”本身就是域名,扫描这几个字也就能够自动跳转。
为了区别于其他文字,商标通常带有®与™标记,前者指已注册的商标,后者则泛指商标。用于手机扫描的域名也能用这种方法标出,如“支付宝®”就更便于手机锁定识别。
手机扫描有时需要识别额外的路径信息,例如北大影院™/小黄人
会链接到http://theater.pku.edu.cn/小黄人
,而在校园内该链接可简写为影院™/小黄人
。
由于DNS服务的分域性质,一个网域(如某大学的校园网)应当有权自由尝试新的服务,如本文提到的DNS服务扩展。