最近工作需要,要完成一个基于Lotus Domino的网站。由于涉及混合语种问题,网站编码基调定为UTF-8,而且其中有部分需要用LotusScprit代理直接接收HTML Form里Submit过来的数据。以前遇到这个问题都是想办法绕开的,那时候没时间,为了赶进度,只能这样。这次项目时间较富裕,我决定吭一下,看看牙口尚好否。
目标:Decode UTF-8 form data in LotusScript Agent.
Google、Baidu外加IBM Lotus论坛,搜索了一通,有四、五段现成的代码,经测试没有一个对的,想偷懒都不行了:(
转变思路,查询UTF-8编码规则,Baidu上找到一篇关于UTF-8的说明,很不错,终于看懂了字符编码到UTF-8编码的转换规则。
原来UTF-8编码是将字符编码通过一种转换规则变成1~6字节的编码。
浏览器将form中的多字节字符和一部分单字字符转变成这种编码,与其他单字节字符连成字符串,再把其中的空格用“+”代替,就成了在Lotus Agent中接收到的字符串参数了。
由于LotusScript中Uchr()函数最多只能转换双字节字符,3、4字节的字符就不做转换了,保留在原字符串中。
Function Utf8Decode(s As String) As String
Dim i As Integer
Dim tmp As String