php gbk 拼音,php 基于gbk和 Ascii把汉字转换为拼音

在php开发中有把汉字转换为拼音的需求

这里主要说明Ascii和gbk 格式的汉字转为拼音的内容,如果你是utf-8的,那就通过iconv()函数转utf-8为gbk,在进行拼音转换//Ascii转拼音

function asc_to_pinyin($asc,$pyarr){

if($asc<128){

return chr($asc);

}elseif(isset($pyarr[$asc])){

return $pyarr[$asc];

}else{

foreach($pyarr as $id=>$p){

if($id>=$asc){

return $p;

}

}

}

}

//gbk转拼音

function gbk_to_pinyin($txt){

$l = strlen($txt);  //返回字符串长度strlen("证人")以字节为单位,gbk编码下,一个汉字2个字节,所有“证人”长度为4。区别于mb_strlen()已个数为单位返回长度,mb_strlen(“证人”);返回长度2

$i = 0;

$pyarr = array();

$py = array();

$filename = 'gb-pinyin.table';  //拼音表文件,这里路径根据文件位置自行设置

$fp = fopen($filename,'r');

while(!feof($fp)){

$p = explode("-",fgets($fp,32)); //fgets()经常和while循环配合使用,因为fgets()读取内容是以行为单位的。读完一行就立马返回(前提是这一行没有到达文件末尾,并且是在设定的长度范围内)。所以要在循环中一行一行读取。从 handle 指向的文件中读取一行并返回长度最多为 length - 1 字节的字符串。碰到换行符(包括在返回值中)、EOF 或者已经读取了 length - 1 字节后停止(看先碰到那一种情况)。如果没有指定 length,则默认为 1K,或者说 1024 字节。

$pyarr[intval($p[1])] = trim($p[0]);

}

fclose($fp);

ksort($pyarr);

while($i

$tmp = ord($txt[$i]);

if($tmp>=128){

$asc = abs($tmp*256+ord($txt[$i+1])-65536);

$i = $i+1;

}else{

$asc = $tmp;

}

$py[] = asc_to_pinyin($asc,$pyarr);

$i++;

}

return $py;

}

$py = gbk_to_pinyin('证人');

print_r($py);

结果:Array

(

[0] => zheng

[1] => ren

)

下载拼音库文件,下载之后自己保存为gb-pinyin.table

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: GBK汉字编码拼音对照表是一种将汉字拼音进行对应的表格。GBK是一种编码标准,可以用于表示中文字符,拼音是一种用于表示汉字发音的系统。 GBK汉字编码拼音对照表的目的是为了方便人们在计算机中使用汉字时能够正确输入和显示相关的拼音。它通常以一个表格的形式呈现,表格上列出了一系列的汉字和对应的拼音。 其中,每个汉字都有一个唯一的编码值与之对应。这种编码值是计算机内部用来表示汉字的一种数字表示方法。而对应的拼音则是为了方便人们通过拼音输入或查找相应的汉字。 在GBK汉字编码拼音对照表中,通常会按照拼音的音节进行分类,比如按照“b,p,m,f”等声母进行分组。每个声母下面列出相应拼音的韵母,然后再列出该韵母下对应的汉字。 这样的对照表能够帮助人们在计算机上快速找到特定汉字拼音,也方便人们通过拼音输入生词或者查询相关的汉字。它对于中文输入和汉字查询具有很大的帮助作用,使得计算机处理中文字符更加方便和准确。 ### 回答2: GBK汉字内码扩展规范)是中国国家标准总局和中国国家语言文字工作委员会联合制定的一种汉字编码标准。它是汉字内码扩展规范(GB 13000)的一部分。 GBK汉字编码拼音对照表是一个记录了汉字拼音和对应编码的表格。GBK编码包含了汉字的多种字符集,包括简体字、繁体字以及一些特殊的字符。 拼音是一种用拉丁字母标记汉字发音的方法。在GBK汉字编码拼音对照表中,每个汉字都对应一个拼音,以及一个唯一的编码。根据拼音对照表,我们可以通过拼音来查找一个汉字的编码,反之亦然。 GBK汉字编码拼音对照表的目的是提供一个规范的汉字编码和拼音对照的参考,方便人们在输入、查询和信息交流等方面使用。对于从事文字处理、编码转换和语言处理的软件开发者来说,拼音对照表是一个重要的工具。 通过GBK汉字编码拼音对照表,人们可以更方便地输入汉字、进行汉字查询和进行文本处理。它对电脑输入法、文字识别、文本处理等领域都有着重要的应用价值。 总的来说,GBK汉字编码拼音对照表是一个记录了汉字拼音和编码对应关系的表格,它在汉字输入、查询和文字处理等方面起到了重要的作用。 ### 回答3: GBK汉字编码拼音对照表是一份用于将汉字拼音对应起来的列表。GBK是国家标准GB 2312-1980的扩展版本,它包括了大部分的中文字符,以及一些繁体字和少部分外文字符。 在GBK编码中,每个汉字都有一个唯一的编码,可以用一个整数表示。而拼音则是代表汉字读音的字母组合。因此,汉字拼音可以通过对照表来一一对应。 在GBK编码拼音对照表中,首先按照字母顺序排列了所有的拼音。然后,每个拼音下面列出了相应的汉字。对于多音字,通常会在汉字后面用注音的方式标记出不同的读音选项。 通过这份对照表,我们可以方便地找到某个汉字拼音,或者查找某个拼音对应的汉字。这对于学习汉语拼音、输入法输入或者查找字词意义都非常有用。 总之,GBK汉字编码拼音对照表是将汉字拼音对应起来的一份列表,方便人们学习和使用汉语。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值