php中usc2编码,规则编码说明

本文详细介绍了网页编码的各种类型,包括GBK、UTF-8、GB2312转UTF-8以及USC2等,讲解了在不同场景下如何选择和转换编码以解决乱码问题。同时,提到了协议头中的编码设置、登录和发布时的编码处理,以及在自动化工具中如何使用编码和解码标签来确保数据正确提交。还特别强调了在遇到特殊字符和符号时的编码转换技巧,以及如何处理不同规则下文章编码的差异。
摘要由CSDN通过智能技术生成

标签: [编码][/编码]

--通常,中文网站的编码只需要测试这4中,“gbk、utf8、gb2312转utf8”,部分是\u9a8c是这样的,需要用编码“usc2”;

--如果还是不行,那查看一下协议头中是否有编码设置,如果有也设置一下。

常用编码1: gbk                --如:%C9%F1%C6%F7 或 中文 (包含gb2312)

常用编码2: utf8               --如:%E7%A5%9E%E5%99%A8

常用编码3:gb2312转utf8--如:绁炲櫒,鎺ㄥ瀛愭墜娉昦sa(这是不常见字或符号,在某些抓包工具里面,可能会显示乱码,只需要复制到规则编辑器,即可显示为文本,如下图。转为这种编码后,文本编辑器中,显示为“乱码”,所以很多时候,是不能转回去的,因为文本编辑器丢失了部分数据。通常,我们提交给服务器的时候,才需要转为utf8,平时乱码显示出来我们也没任何用处。)

big5--如:繁體臺灣論壇 (繁体台湾论坛)

utf8_25--如:%25E7%25A5%259E%25E5%2599%25A8

url_gbk--如:http%3A%2F%2Fwzdr论坛  [3.7.1.1以上版本支持]

url_utf8--如:http%3A%2F%2Fwzdr璁哄潧[3.7.1.1以上版本支持]

[比如下面这个截图,很明显编码是gb2312转utf8]

f8fdcdb93ae0ed5ea10c1cadcf3c86a4.png

[如果以上几个编码发布后,文章依旧乱码,那么可以考虑不设置编码,如 帝国gbk版就不需要设置编码。]

usc2--例1:%u9A8C%u8BC1%u7801%u9519%u8BEF%2C%u4EE3%u7801%3A%28abc123%29

(转为%u开头,转换 { }[ ]( ):,"等括号)

--例2:\u9A8C\u8BC1\u7801\u9519\u8BEF%2C\u4EE3\u7801%3A%28abc123%29

(转为\u开头,转换 { }[ ]( ):,"等括号)

usc2_c 或usc2_5C--如:%5C9A8C%5C8BC1%5C7801%5C9519%5C8BEF%2C%5C4EE3%5C7801%3A%28abc123%29

(转为%5C开头,转换 { }[ ]( ):,"等括号)

----上面的编码都自动转换了符号,实战中,我们发现转换符号也能正常提交。[2016-04-03]

--以上usc2解码结果为:验证码错误,代码:(abc123)

--以上usc2_* 编码需要3.0.2.6以上版本支持

--注意 [编码][/编码] 不能和 [登录编码][/登录编码] 、[发布编码][/发布编码] 共存

错误用法1:

[编码]utf8[/编码]--这个是全局编码标签

[登录编码]gbk[/登录编码]--不能和全局编码标签公用

[发布编码]utf8[/发布编码]--不能和全局编码标签公用错误用法2:

[发布编码]utf8[/发布编码]--发布编码标签

[发布提交网址1]http://t.wzdr.cn/?{usc2_b:{文章标题}} {usc2_b:{文章内容}}[/发布提交网址1]--独立编码标签,不能和发布编码标签、登录编码标签公用,删除上面的发布编码标签即可

正确用法1:

[登录编码]gbk[/登录编码]

[发布编码]utf8[/发布编码]

正确用法2:[编码]utf8[/编码]

--[编码]不应该和 [登录编码]、[发布编码]共存,否则第2次可能会编码返回错误。

--返回编码标签说明:用于单独返回某个提交网址编码的(也就是解码用的)

例(3.2.5.0之前的旧版):

[编码]utf8[/编码]

[登录提交网址1]http://dede57.wzdr.cn/member/index_do.php[/登录提交网址1] 返回编码=gbk;

--支持标签有:返回编码=gbk; 返回编码=utf8; 返回编码=usc2; 返回编码=big5;

例(3.2.5.1新版):

[登录1返回编码]utf8[/登录1返回编码]

[登录提交网址1]http://dede57.wzdr.cn/member/index_do.php[/登录提交网址1]

针对[发布*返回编码]标签特殊说明:

准确说,应该是[发布*返回解码],只会解码提交网址返回的文本,并不能进行{文章内容}的编码。

(初期标签文字设置有误,所以一直就这样没改)

另外一种特殊情况:

当关键词.txt  或词库txt里面编码为utf-8时,那么发布后的编码{关键词}部分可能会乱码。

异常情况编码为UTF-8:

11e81a84e6057163ee9a52d59dcca537.png

正常情况编码为ANSI:

539502fcfed6f8949663bdf02858813d.png

解决方法,按F8或F9,选择ANSI(936):

45d0a3951d2564cb4084ea37c6981f39.png

另一种特殊情况编码问题:

就是协议头里面含有编码的,那么协议头也得加上,否则编码就会不正确。

03a082cb38a8ad2f9f8acb065a89f537.png

例:[登录协议头1]Content-Type: application/json; charset=utf-8[/登录协议头1]

关于注册时,汉字帐号的编码问题:

例1:

[登录提交数据1]username={随机姓氏=汉}{随机汉字=2}&usertel=133{随机数字=8}&answerid=5760[/登录提交数据1]

--由于这个是gbk编码的,所以可以直接提交汉字标签就可以了,可以不进行编码转换

如果遇到其他utf8编码的,才需要下面的标签来处理:

例2:(独立编码需要3.044以上版本支持)

[登录提交网址2]http://t.wzdr.cn/?{utf8:{随机姓氏=汉}}{utf8:{随机汉字=2}}[/登录提交网址2]

347dd12c28c5f156dc8ad91e35927b9e.png

例3:

[登录提交网址1]http://t.wzdr.cn/?{utf8:{词库1}}、{utf8:{词库1}}、{utf8:{词库1}}、{utf8:{词库2}}|{随机姓氏=汉}|{utf8:{变量1}}|不编码:{词库1}|{utf8:{随机姓氏=汉}}自定义:{utf8:测试abc}[/登录提交网址1]

[登录提交网址2]http://t.wzdr.cn/?{utf8:{随机姓氏=汉}}{utf8:{随机汉字=2}}[/登录提交网址2]

[发布前提交网址1]http://t.wzdr.cn/jb1.html[/发布前提交网址1]

[发布前提交1参数1](.*?)"

test2="888"[/发布前提交1参数1]

[发布提交网址1]http://t.wzdr.cn/?{utf8:{发布前提交1参数1}}[/发布提交网址1]

例4:

[发布验证码]http://open.soft.360.cn/img.php?nowtime=1421670566945[/发布验证码]

[发布1返回编码]usc2[/发布1返回编码]

[发布提交网址1]http://t.wzdr.cn/?{utf8:{发布验证码}}[/发布提交网址1]

[发布提交数据1]t={utf8:{文章标题}}&b={utf8:{文章内容}}[/发布提交数据1]

ffd83743c67d96c51cf65e5bcbf7c83c.png

例5:

[发布成功特征1]>发表于 <===发布成功了哦。。。{gbk解码:{关键词}}[/发布成功特征1] --如果中文关键词输出到工作日志,可能会被编码,那么需要在这里手动解码

3.148以后版本支持独立解码,如:{utf8解码:{登录提交1参数3}} 、{usc2解码:{词库1}}

更多解码支持:utf8解码 base64解码 gbk解码 utf8转gb2312 usc2解码

Q、解码标签一般什么时候才用?

答:某些时候,解码的内容并不能完整还原,所以我们一般提交数据不需要用到解码标签。这个标签的目的,是为了在特殊情况下,让工作日志显示某些内容。(如下)

[发布成功特征1]ok====发布成功,当前账号:{utf8解码:{发布前提交1参数1}}[/发布成功特征1]

[发布成功特征1]ok====发布成功,标题:{utf8解码:{文章标题}}[/发布成功特征1]

例6:

关于符号“$/+=:”的编码转换问题

以前旧版,没有独立的编码转换标签,所以我们使用替换标签来编码这些符号。现在的新版,完全可以采用独立编码标签来转换,非常方便。

规则:

[登录提交网址1]c:\1.txt[/登录提交网址1]--txt存放内容为:$/+=:

[登录提交1参数1](.*)[/登录提交1参数1]--正则取txt里面全部文本

[登录提交网址2]http://t.wzdr.cn/?{utf8:{登录提交1参数1}}?{md5:{密码}}[/登录提交网址2]--独立编码参数1

[登录提交网址1]http://t.wzdr.cn/?{base64:{词库1}}[/登录提交网址1]

报告:

■■■■■■■■[20:34:16] 登录提交网址1 【处理前】: c:\1.txt

■■■■■■■■[20:34:16] 登录提交网址1 【处理后】: c:\1.txt

■■■■■■■■[20:34:16] 登录提交网址1 【返回】: $/+=:

■■■■■■■■[20:34:16] 登录提交1参数1 【正则 处理前】: (.*)

■■■■■■■■[20:34:16] 登录提交1参数1 【正则 处理后】: (.*)

■■■■■■■■[20:34:16] 登录提交1参数1 【正则 结果】: $/+=:

■■■■■■■■[20:34:16] 登录提交网址2 【处理前】: http://t.wzdr.cn/?{utf8:{登录提交1参数1}}

■■■■■■■■[20:34:16] 登录提交网址2 【处理后】: http://t.wzdr.cn/?%24%2F%2B%3D%3A

■■■■■■■■[20:34:16] 登录提交网址2 【返回】:

更多md5加密标签:

{md5:{密码}}

{md5_32:{密码}}

{md5_32_大写:{密码}}

{md5_16:{密码}}

{md5_16_大写:{密码}}

Q、其他相关

escape --Escape编码 %u795E%u5668%20wzdr

escape_25 --Escape编码 ,把“%”替换为“%25”

encode --Encode编码 %C9%F1%C6%F7%20wzdr

Q、如何让不同的规则,设置不同的文章编码?

[2015-12-06更新]

[2016-04-03更新]

[2016-07-17更新]

[2016-08-09更新]

[2016-08-13更新]

[2016-10-30更新]

[2016-11-09更新]

[2017-04-08更新]

[2017-06-22更新]

[2017-10-09更新]

[2017-11-21更新]

[2018-03-17更新]

[2018-04-24更新]

[2019-11-19更新]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值