ruby 的字节(byte)跟unicode(利用iconv进行编码转换)



require 'iconv'
$KCODE='u'

class String
def String.safe_iconv(str_utf8)
sentan=""
koutan= str_utf8.to_s
while sentan.to_s.size < str_utf8.to_s.size
begin
return sentan = sentan.to_s + Iconv.iconv('SHIFT_JIS','UTF-8', koutan)[0]
rescue Iconv::Failure => e
sentan = sentan.to_s + e.success.to_s
koutan = e.failed.to_s.sub(/^\S/,"?")
end
end
end
end


puts String.safe_iconv("Zörkendörfer ")



上面一段代码加不加$KCODE='u'结果是不一样的。
$KCODE
Ruby の認識するマルチバイト文字列エンコーディングです。変数の値は "EUC" "SJIS" "UTF8" "NONE" のいずれかの文字列です。
ruby 认识的复合字节字符串uncoding。可以选择"EUC" "SJIS" "UTF8" "NONE中的任意一个

$KCODE の値が "EUC" のときは文字列や正規表現のエンコーディングが EUC-JP であると仮定します。同様に "SJIS" のときは Shift JIS を仮定します。 "UTF8" のときは UTF-8 を仮定します。 "NONE" のときはマルチバイト文字列を認識しません。

$KCODE的值是"EUC"的时候字符串和正则表达式解码(uncoding)采取EUC-JP方式假设
$KCODE的值是"SJIS"的时候字符串和正则表达式解码(uncoding)采取SJIS方式假设
$KCODE的值是"NONE"的时候字符串和正则表达式解码(uncoding)采取NONE方式假设
NONE的时候不能为复合字节字符串解码

另外还有个方法可以认识复合字节的字符串,用ActiveSupport里面的chars类
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值