php保存gbk字符串,php判断字符串gbk/utf8编码和转换

本文介绍了如何使用PHP来判断和转换歌曲文件的ID3信息,免去用户手动填写表单的步骤。重点是两个函数,is_utf8()用于检测UTF-8编码,is_gb2312()用于判断GBK编码,并提供了转换编码的示例,特别是对于日文编码通常采用的shift-jis到utf-8的转换。
摘要由CSDN通过智能技术生成

代码就点击进来看吧。前段时间聊天的时候卜卜口提到可以由程序提取歌曲文件的ID3信息,这样就免去那些音乐上传时候用户填写表单的步骤。仔细想想这么利国利民的东西必需试试!首先考虑到的就是编码的判断,在网上找到别人写好的代码,经测试效果赞~\(≧▽≦)/~

先来两个判断gbk/utf-8的函数

[php]

function is_utf8($string) {

return preg_match('%^(?:

[\x09\x0A\x0D\x20-\x7E] # ASCII

| [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte

| \xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs

| [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte

| \xED[\x80-\x9F][\x80-\xBF] # excluding surrogates

| \xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3

| [\xF1-\xF3][\x80-\xBF]{3} # planes 4-15

| \xF4[\x80-\x8F][\x80-\xBF]{2} # plane 16

)*$%xs', $string);

}

function is_gb2312($str)

{

for($i=0; $i127) {

if( ($v >= 228) && ($v <= 233) )

{

if( ($i+2) >= (strlen($str) - 1)) return true;

$v1 = ord( $str[$i+1] );

$v2 = ord( $str[$i+2] );

if( ($v1 >= 128) && ($v1 <=191) && ($v2 >=128) && ($v2 <= 191) )

return false;

else

return true;

}

}

}

return true;

}

[/php]

然后是转换,如果不是gbk也不是utf-8按照我收无损的经验日文编码通常是shift-jis,就按这个转换!

[php]

$str=iconv('shift-jis','utf-8','要转换的内容');

[/php]

搞定~~~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在 Java 中,可以使用以下代码实现将 UTF-8 编码字符串转换GBK 编码字符串: ``` String utf8String = "UTF-8 编码字符串"; byte[] utf8Bytes = utf8String.getBytes("UTF-8"); String gbkString = new String(utf8Bytes, "GBK"); ``` 首先,使用 `getBytes` 方法将字符串转换为字节数组,并指定编码为 UTF-8。然后,使用 `String` 构造函数,将字节数组转换字符串,并指定编码GBK。 ### 回答2: 在Java中,可以使用`Charset`类和`String`类提供的方法来将UTF-8字符串转换GBK字符串。 以下是一个示例代码: ```java import java.nio.charset.Charset; public class CharsetConversion { public static void main(String[] args) { String utf8String = "你好,世界!"; // UTF-8编码字符串 // 将UTF-8字符串转换GBK字符串 Charset utf8Charset = Charset.forName("UTF-8"); Charset gbkCharset = Charset.forName("GBK"); String gbkString = new String(utf8String.getBytes(utf8Charset), gbkCharset); System.out.println("GBK字符串:" + gbkString); } } ``` 以上代码中,首先定义了一个UTF-8编码字符串`utf8String`,然后通过`Charset.forName`方法获取UTF-8和GBK的字符集对象`utf8Charset`和`gbkCharset`。接下来,使用`utf8String.getBytes(utf8Charset)`将UTF-8字符串转换为字节数组,再通过`String`的构造方法将字节数组转换GBK字符串`gbkString`。 最后,代码通过`System.out.println`方法将转换后的GBK字符串输出到控制台。 注意,使用这种方法转换字符串时要确保源字符串编码和目标编码是兼容的,否则可能会出现乱码。 ### 回答3: 要将UTF-8字符串转换GBK字符串,可以使用Java的字符编码转换工具类Charset。 首先,你需要将UTF-8字符串转换为字节数组,然后使用Charset工具类将字节数组转换GBK编码字符串。以下是一个示例代码: ```java import java.nio.charset.Charset; public class Utf8ToGbk { public static void main(String[] args) { String utf8String = "Hello, 世界!"; try { // 将UTF-8字符串转换为字节数组 byte[] utf8Bytes = utf8String.getBytes("UTF-8"); // 将字节数组转换GBK编码字符串 String gbkString = new String(utf8Bytes, Charset.forName("GBK")); System.out.println("原始字符串:" + utf8String); System.out.println("转换后的字符串:" + gbkString); } catch (Exception e) { e.printStackTrace(); } } } ``` 这段代码首先将UTF-8字符串转换为字节数组,然后使用Charset.forName("GBK")将字节数组转换GBK编码字符串。最后,打印输出原始字符串转换后的字符串。 注意,如果UTF-8字符串包含无法转换GBK编码的字符,会抛出异常。因此,需要在代码中进行异常处理。 希望以上代码可以帮助到你。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值