javascript utf-8 url 编码 之 纯算法 解码 by shawl.qiu 2007-9-24

原创 2007年09月24日 01:50:00

javascript utf-8 url 编码 之 纯算法 解码 by shawl.qiu 2007-9-24


说明:
这个东西的用处嘛...
在于, 你使用 非utf-8 编码作为页面编码, 但是接收 request 时, 某页面传递了utf-8 编码的URL 过来...那现在这个函数就大有作为了...

题外话, 最近在研究算法, 刚开始的时候是 hash function, 然后 发现得先学 二进制, 再后来发现得学习 base64, 然后发现得了解编码集, 然后.....
天呀...真个没得完...

shawl.qiu
2007-09-24
http://blog.csdn.net/btbtd

下载:
http://files.myopera.com/btbtd/javascript/function/fPEUtf8ToGb.7z

内容:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>shawl.qiu template</title>
<style type="text/css">
/* <![CDATA[ */

/* ]]> */
</style>
<script type="text/javascript">
/*<![CDATA[*/
 if (navigator.appName=="Microsoft Internet Explorer") 
 {
  //最大化窗口
  self.moveTo(-5,-5)
  self.resizeTo(screen.availWidth +8,screen.availHeight+8)
  //这个脚本定义的宽度其实比原窗口还要大那么一点.
 }
/*]]*/
</script>
</head>
<body>
<script type="text/javascript">
/*<![CDATA[*/
 fTestFunc("encodeURIComponent", encodeURIComponent);
 fTestFunc("encodeURI", encodeURI);

 // PE = percent encoding
 function fPEUtf8ToGb(sUtf8PE)
 { // shawl.qiu code, return string; Func: fGetUtf8PE
  if(sUtf8PE.indexOf("%")===-1) return sUtf8PE;
  var iLBound = parseInt("7d"16);
  
  for(var i=0, j=sUtf8PE.length; i<j; i++)
  {
   var iIndex = sUtf8PE.indexOf("%", i);
   if(iIndex===-1) break;
   i=iIndex+1;
   
   var sHex = sUtf8PE.slice(i, i+2);
   if(parseInt(sHex, 16)>iLBound)
   {
    var sHexExt = sUtf8PE.slice(i+2, i+8);
    if(//%../%/.test(sHexExt))
    {
     var TempStr = sUtf8PE.slice(i-1, i+8);
     TempStr = fGetUtf8PE(TempStr);
     sUtf8PE = [sUtf8PE.slice(0, i-1), TempStr, sUtf8PE.slice(i+8)].join("");
     i-=1;
    }
   } // end if(parseInt(sHex, 16)>iLBound)
  } // end for(var i=0, j=sUtf8PE.length; i<j; i++)
  
  if(sUtf8PE.indexOf("%")===-1) return sUtf8PE;
  
  for(var i=0, j=sUtf8PE.length; i<j; i++)
  {
   var iIndex = sUtf8PE.indexOf("%", i);
   if(iIndex===-1) break;
   i=iIndex+1;
   
   var sHex = sUtf8PE.slice(i, i+2);
   var iDec = parseInt(sHex, 16);
   var sAsc = String.fromCharCode(iDec);
   sUtf8PE = [sUtf8PE.slice(0, i-1), sAsc, sUtf8PE.slice(i+2)].join("");
   i-=1;
  } // end for(var i=0, j=sUtf8PE.length; i<j; i++)
  
  return sUtf8PE;
 } // end function fPEUtf8ToGb(sUtf8PE)

 // PE = percent encoding
 function fGetUtf8PE(sUtf8PE) // %xx%xx%xx
 { // shawl.qiu code, return string
  var Ar = sUtf8PE.replace(//%/"").split("%");
  var TAr = [];
  for(var i=0, j=Ar.length; i<j; i++) 
  {
   Ar[i] = parseInt(Ar[i]16).toString(2);
   var iZeroIndex = Ar[i].indexOf("0");
    if(i===0)
    {
     Ar[i] = Ar[i].slice(iZeroIndex+1);
     TAr.push(Ar[i]);
    }
    else
    {
     Ar[i] = Ar[i].substr(2);
     TAr.push(Ar[i]);
    }
  } // end for(var i=0, j=Ar.length; i<j; i++) 
  var sHex = parseInt(TAr.join("")2).toString(16);
  return unescape("%u"+sHex);
 } // end function fGetUtf8PE(sUtf8PE)

 function fTestFunc(sMsg, Func)
 {
  document.write("<p/>"+sMsg.bold()+":<p/> /n");
  
  var str = "搜";
  var s = Func(str)
  var c = fPEUtf8ToGb(s);
  
  document.write("Test String: "+str+"<br/>/n");
  document.write("&nbsp;&nbsp;Encoding: "+s+"<br/>/n");
  document.write("<p/>&nbsp;&nbsp;Decoding: "+c+"<hr/>/n/n");
  
  //----------------------------------
  
  var str = "1923809=-02343+|+|_l'kl'k中是; 苯胺中kj";
  var s = Func(str)
  var c = fPEUtf8ToGb(s);
  
  document.write("Test String: "+str+"<br/>/n");
  document.write("&nbsp;&nbsp;Encoding: "+s+"<br/>/n");
  document.write("<p/>&nbsp;&nbsp;Decoding: "+c+"<hr/>/n/n");
  
  //----------------------------------
  
  var str = ")_()_(*(**(&*&(:J:KJuyjsdfj7867813dj|_)_09-090///|_+)_}/"L/":<>j";
  var s = Func(str)
  var c = fPEUtf8ToGb(s);
  
  document.write("Test String: "+str+"<br/>/n");
  document.write("&nbsp;&nbsp;Encoding: "+s+"<br/>/n");
  document.write("<p/>&nbsp;&nbsp;Decoding: "+c+"<hr/>/n/n");
  
  //----------------------------------
 } 
/*]]*/
</script>
</body>
</html>



 

URL编码解码以及常见压缩算法和加密

1) 将客户端在进行网址请求的时候,如果网址中使用了非ASCII码形式的内。比如百度可以使用中文搜索但是sougou搜索那么就需要进行编码 2)URLEncoding:在编码的时候保留所有的英文字母...
  • blueZhangFun
  • blueZhangFun
  • 2015年10月17日 09:34
  • 2380

JS对URL字符串进行编码/解码分析

一、为什么要进行js编码和解码?   只有字母和数字[0-9a-zA-Z]、一些特殊符号“$-_.+!*'(),”[不包括双引号]、以及某些保留字,才可以不经过编码直接用于URL。 ...
  • lishimin1012
  • lishimin1012
  • 2016年10月15日 15:42
  • 5202

URL编码与解码原理

通常如果一样东西需要编码,说明这样东西并不适合传输。原因多种多样,如Size过大,包含隐私数据,对于Url来说,之所以要进行编码,是因为Url中有些字符会引起歧义。   例如,Url参数字符串中使用...
  • zmx729618
  • zmx729618
  • 2016年05月12日 10:01
  • 13345

C语言实现url的编码和解码

url提交信息为何要转码呢?因为url本身会有很多特殊字符。而提交的参数中如果再有特殊字符的话,url就不能区分哪些是参数内容,哪些是分隔符。尤其是unicode,gb18030,big5等多字节的编...
  • tennysonsky
  • tennysonsky
  • 2017年01月07日 18:19
  • 2037

使用 URLDecoder 和 URLEncoder 对中文字符进行编码和解码

URLDecoder 和 URLEncoder 用于完成普通字符串 和 application/x-www-form-urlencoded MIME 字符串之间的相互转换。在本文中,我们以使用URLD...
  • justloveyou_
  • justloveyou_
  • 2017年02月25日 23:17
  • 11709

字符编解码的故事(ASCII,GBK,Unicode,Utf-8区别)

此文为转载,有少许修订,原文出处不详。 很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们认为8个开关状态作为原子单位很好,于是他们把这称为"字节"。...
  • Simba888888
  • Simba888888
  • 2013年07月19日 21:00
  • 2562

使用Java对UTF8URL进行编码解码以及进行编码方式的判断

更多技术文章请访问我的个人博客在用搜索引擎搜索时,所输入的字符通常会被编码然后再查询,这篇文章将Java中对UTF8字符编码方式的检测,UTF8URL编码解码的代码挂了出来,需要时改变main函数中的...
  • rain_web
  • rain_web
  • 2017年02月08日 21:40
  • 1412

encode_utf8 把字符编码成字节 decode_utf8解码UTF-8到字符

encode_utf8 $octets = encode_utf8($string); Equivalent to "$octets = encode("utf8", $stri...
  • zhaoyangjian724
  • zhaoyangjian724
  • 2016年07月10日 11:38
  • 1083

C++ url编解码类

//UrlConvert.h #ifndef __URLCONVERT_H__ #define __URLCONVERT_H__ #pragma once /* 使用方法: CUrlConvert u...
  • sunflover454
  • sunflover454
  • 2016年12月26日 13:33
  • 398

URL 传参编码&解码

以前做好的一个页面,突然被告知乱码了,当时吓一跳,好在没有影响线上数据,于是找出原因,以前开发项目几乎全是在火狐上测试使用的,然后今天早上找了一下,发现火狐不报错,其他浏览器报错,于是用IE试了一下,...
  • nnn_net
  • nnn_net
  • 2016年11月23日 14:17
  • 1463
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:javascript utf-8 url 编码 之 纯算法 解码 by shawl.qiu 2007-9-24
举报原因:
原因补充:

(最多只允许输入30个字)