php 字符编码转换类,支持ANSI Unicode Unicode big endian UTF-8 UTF-8+Bo

分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow

也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!

               

php 字符编码转换类,支持ANSI、Unicode、Unicode big endian、UTF-8、UTF-8+Bom 互相转换。


四种常见文本文件编码方式

ANSI编码

无文件头(文件编码开头标志性字节)

ANSI编码字母数字占一个字节,汉字占两个字节

回车换行符,单字节, 十六进制表示为0d  0a


UNICODE编码:

文件头,十六进制表示为FF FE

每一个字符都用两个字节编码

回车换行符, 双字节,十六进制表示为 000d  000a


Unicode big endian编码:

文件头十六进制表示为FE FF

后面编码是把字符的高位放在前面,低位放在后面,正好和Unicode编码颠倒

回车换行符,双字节,十六进制表示为0d00  0a00


UTF-8 编码:

文件头,十六进制表示为EF BB BF

UTF-8是Unicode的一种变长字符编码,数字、字母、回车、换行都用一个字节表示,汉字占3个字节

回车换行符,单字节,十六进制表示为0d 0a


转换原理:先把字符编码转为UTF-8,然后再从UTF-8转换为对应的字符编码。


CharsetConv.class.php

<?php/** 字符编码转换类, ANSI、Unicode、Unicode big endian、UTF-8、UTF-8+Bom互相转换*   Date:   2015-01-28*   Author: fdipzone*   Ver:    1.0**   Func:*   public  convert       转换*   private convToUtf8    把编码转为UTF-8编码*   private convFromUtf8  把UTF-8编码转换为输出编码*/class CharsetConv{ // class start    private $_in_charset = null;   // 源编码    private $_out_charset = null// 输出编码    private $_allow_charset = array('utf-8', 'utf-8bom', 'ansi', 'unicode', 'unicodebe');    /** 初始化    * @param String $in_charset  源编码    * @param String $out_charset 输出编码    */    public function __construct($in_charset, $out_charset){        $in_charset = strtolower($in_charset);        $out_charset = strtolower($out_charset);        // 检查源编码        if(in_array($in_charset, $this->_allow_charset)){            $this->_in_charset = $in_charset;        }        // 检查输出编码        if(in_array($out_charset, $this->_allow_charset)){            $this->_out_charset = $out_charset;        }    }    /** 转换    * @param  String $str 要转换的字符串    * @return String      转换后的字符串    */    public function convert($str){        $str = $this->convToUtf8($str);   // 先转为utf8        $str = $this->convFromUtf8($str); // 从utf8转为对应的编码        return $str;    }    /** 把编码转为UTF-8编码    * @param  String $str     * @return String    */    private function convToUtf8($str){        if($this->_in_charset=='utf-8'){ // 编码已经是utf-8,不用转            return $str;        }        switch($this->_in_charset){            case 'utf-8bom':                $str = substr($str, 3);                break;            case 'ansi':                $str = iconv('GBK', 'UTF-8//IGNORE', $str);                break;            case 'unicode':                $str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2));                break;            case 'unicodebe':                $str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2));                break;            default:                break;        }        return $str;    }    /** 把UTF-8编码转换为输出编码    * @param  String $str    * @return String    */    private function convFromUtf8($str){        if($this->_out_charset=='utf-8'){ // 输出编码已经是utf-8,不用转            return $str;        }        switch($this->_out_charset){            case 'utf-8bom':                $str = "\xef\xbb\xbf".$str;                break;            case 'ansi':                $str = iconv('UTF-8', 'GBK//IGNORE', $str);                break;            case 'unicode':                $str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str);                break;            case 'unicodebe':                $str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str);                break;            default:                break;        }        return $str;    }} // class end?>

demo:unicode big endian 转为 utf-8+bom

<?phprequire "CharsetConv.class.php";$str = file_get_contents('source/unicodebe.txt');$obj = new CharsetConv('unicodebe', 'utf-8bom');$response = $obj->convert($str);file_put_contents('response/utf-8bom.txt', $response, true);?>

源码下载地址:点击查看




           

给我老师的人工智能教程打call!http://blog.csdn.net/jiangjunshow
这里写图片描述
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值