符号乱码解决方法

8 篇文章 0 订阅

工作中,我们的一些description内容,会被其他平台引用,但是格式又不一样,我们转换为对方的格式,又发现还有乱码,而仅仅是一些符号的乱码,这个时候,该怎么处理呢,我这里提供一种方式

分享一个网站,各个符号的编码格式

http://utf8-chartable.de/unicode-utf8-table.pl?start=8192&number=128&utf8=dec

上面网站可以查看乱码符号的编码,我们可以捕捉常用的符号,然后替换。

   def clean_non_ascii_chr(text_result)
     1.7 -     ascii_chr = {/\xE2\x80\x99/ => '\'',/\xE2\x80\x98/=>'\'', /\xC2\xA0/=>' ', /\xE2\x80\x91/=>'-', /\xE2\x80\x92/=>'-', /\xE2\x80\x93/=>'-', /\xE2\x80\x94/=>'-',/\xE2\x80\x95/=>'-', /\xE2\x80\x9c/=>'\"', /\xE2\x80\x9D/=>'\"', /\xE2\x80\xA2/=>' ',/\xC2\xB7/=>' ', /\xE2\x80\xA6/=>'...', /\xE2\x80\xaf/=>' '}  
     1.8 +     ascii_chr = { /\xE2\x80\x99/ => '\'', /\xE2\x80\x98/=>'\'', 
     1.9 +                   /\xC2\xA0/=>' ', /\xE2\x80\x91/=>'-', 
    1.10 +                   /\xE2\x80\x92/=>'-', /\xE2\x80\x93/=>'-', 
    1.11 +                   /\xE2\x80\x94/=>'-',/\xE2\x80\x95/=>'-', 
    1.12 +                   /\xE2\x80\x9c/=>'\"', /\xE2\x80\x9D/=>'\"', 
    1.13 +                   /\xE2\x80\xA2/=>' ',/\xC2\xB7/=>' ', 
    1.14 +                   /\xE2\x80\xA6/=>'...', /\xE2\x80\xaf/=>' '}  
    1.15       ascii_chr.each do |key,value|
    1.16         text_result = text_result.gsub(key,value)  
    1.17       end

上面是Ruby代码,其他语言逻辑同样适用,希望能够帮助到大家



以上是我的总结想法,或许还有些不成熟,不妥之处,请指正,谢谢。

name: eric

email:


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值