javascript utf-8 url 编码 之 纯算法 解码 by shawl.qiu 2007-9-24

原创 2007年09月24日 01:50:00

javascript utf-8 url 编码 之 纯算法 解码 by shawl.qiu 2007-9-24


说明:
这个东西的用处嘛...
在于, 你使用 非utf-8 编码作为页面编码, 但是接收 request 时, 某页面传递了utf-8 编码的URL 过来...那现在这个函数就大有作为了...

题外话, 最近在研究算法, 刚开始的时候是 hash function, 然后 发现得先学 二进制, 再后来发现得学习 base64, 然后发现得了解编码集, 然后.....
天呀...真个没得完...

shawl.qiu
2007-09-24
http://blog.csdn.net/btbtd

下载:
http://files.myopera.com/btbtd/javascript/function/fPEUtf8ToGb.7z

内容:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>shawl.qiu template</title>
<style type="text/css">
/* <![CDATA[ */

/* ]]> */
</style>
<script type="text/javascript">
/*<![CDATA[*/
 if (navigator.appName=="Microsoft Internet Explorer") 
 {
  //最大化窗口
  self.moveTo(-5,-5)
  self.resizeTo(screen.availWidth +8,screen.availHeight+8)
  //这个脚本定义的宽度其实比原窗口还要大那么一点.
 }
/*]]*/
</script>
</head>
<body>
<script type="text/javascript">
/*<![CDATA[*/
 fTestFunc("encodeURIComponent", encodeURIComponent);
 fTestFunc("encodeURI", encodeURI);

 // PE = percent encoding
 function fPEUtf8ToGb(sUtf8PE)
 { // shawl.qiu code, return string; Func: fGetUtf8PE
  if(sUtf8PE.indexOf("%")===-1) return sUtf8PE;
  var iLBound = parseInt("7d"16);
  
  for(var i=0, j=sUtf8PE.length; i<j; i++)
  {
   var iIndex = sUtf8PE.indexOf("%", i);
   if(iIndex===-1) break;
   i=iIndex+1;
   
   var sHex = sUtf8PE.slice(i, i+2);
   if(parseInt(sHex, 16)>iLBound)
   {
    var sHexExt = sUtf8PE.slice(i+2, i+8);
    if(//%../%/.test(sHexExt))
    {
     var TempStr = sUtf8PE.slice(i-1, i+8);
     TempStr = fGetUtf8PE(TempStr);
     sUtf8PE = [sUtf8PE.slice(0, i-1), TempStr, sUtf8PE.slice(i+8)].join("");
     i-=1;
    }
   } // end if(parseInt(sHex, 16)>iLBound)
  } // end for(var i=0, j=sUtf8PE.length; i<j; i++)
  
  if(sUtf8PE.indexOf("%")===-1) return sUtf8PE;
  
  for(var i=0, j=sUtf8PE.length; i<j; i++)
  {
   var iIndex = sUtf8PE.indexOf("%", i);
   if(iIndex===-1) break;
   i=iIndex+1;
   
   var sHex = sUtf8PE.slice(i, i+2);
   var iDec = parseInt(sHex, 16);
   var sAsc = String.fromCharCode(iDec);
   sUtf8PE = [sUtf8PE.slice(0, i-1), sAsc, sUtf8PE.slice(i+2)].join("");
   i-=1;
  } // end for(var i=0, j=sUtf8PE.length; i<j; i++)
  
  return sUtf8PE;
 } // end function fPEUtf8ToGb(sUtf8PE)

 // PE = percent encoding
 function fGetUtf8PE(sUtf8PE) // %xx%xx%xx
 { // shawl.qiu code, return string
  var Ar = sUtf8PE.replace(//%/"").split("%");
  var TAr = [];
  for(var i=0, j=Ar.length; i<j; i++) 
  {
   Ar[i] = parseInt(Ar[i]16).toString(2);
   var iZeroIndex = Ar[i].indexOf("0");
    if(i===0)
    {
     Ar[i] = Ar[i].slice(iZeroIndex+1);
     TAr.push(Ar[i]);
    }
    else
    {
     Ar[i] = Ar[i].substr(2);
     TAr.push(Ar[i]);
    }
  } // end for(var i=0, j=Ar.length; i<j; i++) 
  var sHex = parseInt(TAr.join("")2).toString(16);
  return unescape("%u"+sHex);
 } // end function fGetUtf8PE(sUtf8PE)

 function fTestFunc(sMsg, Func)
 {
  document.write("<p/>"+sMsg.bold()+":<p/> /n");
  
  var str = "搜";
  var s = Func(str)
  var c = fPEUtf8ToGb(s);
  
  document.write("Test String: "+str+"<br/>/n");
  document.write("&nbsp;&nbsp;Encoding: "+s+"<br/>/n");
  document.write("<p/>&nbsp;&nbsp;Decoding: "+c+"<hr/>/n/n");
  
  //----------------------------------
  
  var str = "1923809=-02343+|+|_l'kl'k中是; 苯胺中kj";
  var s = Func(str)
  var c = fPEUtf8ToGb(s);
  
  document.write("Test String: "+str+"<br/>/n");
  document.write("&nbsp;&nbsp;Encoding: "+s+"<br/>/n");
  document.write("<p/>&nbsp;&nbsp;Decoding: "+c+"<hr/>/n/n");
  
  //----------------------------------
  
  var str = ")_()_(*(**(&*&(:J:KJuyjsdfj7867813dj|_)_09-090///|_+)_}/"L/":<>j";
  var s = Func(str)
  var c = fPEUtf8ToGb(s);
  
  document.write("Test String: "+str+"<br/>/n");
  document.write("&nbsp;&nbsp;Encoding: "+s+"<br/>/n");
  document.write("<p/>&nbsp;&nbsp;Decoding: "+c+"<hr/>/n/n");
  
  //----------------------------------
 } 
/*]]*/
</script>
</body>
</html>



 

相关文章推荐

VBS和ASP中的各种编码转换GB2312、UTF-8、Unicode、URL解码、二进制、十进制代码、十六进制

'UTF转GB---将UTF8编码文字转换为GB编码文字 function UTF2GB(UTFStr) for Dig=1 to len(UTFStr) '如果UTF8编码文字以%开头...
  • wqsys
  • wqsys
  • 2012年07月21日 10:11
  • 2813

URL编码方法比较 Encode,Javascript,escape,encodeURI,encodeURIComponent,UTF-8javascript

javascript中存在几种对url字符串进行编码的方法:escape(),encodeuri(),以及encodeuricomponent()。这几种编码所起的作用各不相同。 escape() ...

url编解码utf-8 ANSI 解码工具

  • 2012年06月21日 15:44
  • 231KB
  • 下载

Utf-8编码与解码(vb6代码)

  • 2016年03月01日 22:10
  • 12KB
  • 下载

对UTF-8和GB2312格式 URL进行解码

对UTF-8和GB2312格式 URL进行解码 新的系统编码格式是:UTF-8   老的页面编码格式是: GB2312  新的系统的URL参数(带中文) 提交到老的系统中,中文参数是乱码。 ...

实现UTF-8、UCS2编码和解码

编码的原理知识可以看:https://www.zhihu.com/question/23374078 public void encodeDecode(){ String str...

GBK,UTF-8,和ISO8859-1之间的编码与解码

Unicode、UTF-8 和 ISO8859-1到底有什么区别 将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF...

编码解码!(UTF-8,iso8859-1,gbk)

/* 编码:字符串变成字节数组 String---->byte[]: str.getBytes(charsetName); byte[]---->String new String(byte...

编码URLEncoder和解码URLDecoder的UTF-8到GBK的转码

package com.kk; import java.io.UnsupportedEncodingException; import java.net.URLDecoder; import j...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:javascript utf-8 url 编码 之 纯算法 解码 by shawl.qiu 2007-9-24
举报原因:
原因补充:

(最多只允许输入30个字)