将日文半角片假名转换成全角片假名


//区別文字列は、arrayである。注:対象は、全角/半角の片仮名と英語文字のみに限られている。
function my_split($string){
 $count = mb_strlen($string);
 for($i=0;$i<$count;){
  $ordvalue=ord(substr($string,$i,1));
  if($ordvalue==131 || $ordvalue==130 || $ordvalue==129){
   $ret[]=substr($string,$i,2);
   $i+=2;
  }else{
   $ret[]=substr($string,$i,1);
   $i+=1;
  }
 }
 return $ret;
}

//半角の片仮名を全角の片仮名に変換する。
function convKanaZenHan( $str )
{
 $kanaBefore = "ァ ア ィ イ ゥ ウ ェ エ ォ オ カ ガ キ ギ ク グ ケ ゲ コ ゴ サ ザ シ ジ ス ズ セ ゼ ソ ゾ タ ダ チ ヂ ッ ツ ヅ テ デ ト ド ナ ニ ヌ ネ ノ ハ バ パ ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ ボ ポ マ ミ ム メ モ ャ ヤ ュ ユ ョ ヨ ラ リ ル レ ロ ワ ワ ヲ ン ー A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z ,";
 $kanaAfter = "ァ ア ィ イ ゥ ウ ェ エ ォ オ カ ガ キ ギ ク グ ケ ゲ コ ゴ サ ザ シ ジ ス ズ セ ゼ ソ ゾ タ ダ チ ヂ ッ ツ ヅ テ デ ト ド ナ ニ ヌ ネ ノ ハ バ パ ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ ボ ポ マ ミ ム メ モ ャ ヤ ュ ユ ョ ヨ ラ リ ル レ ロ ヮ ワ ヲ ン ー A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z 、";

 $array = my_split($str);

 $backslash = explode(" ",$kanaBefore);
 $chairman = explode(" ",$kanaAfter);

 $restr="";
 foreach($array as $key=>$value){
  $pos=array_search($value,$backslash);
  if(($pos=array_search($value,$backslash))!=null){
   $restr.=$chairman[$pos];
  }else{
   $restr.=$value;
  }
 }
 return $restr;
}
echo convKanaZenHan("ァ ア ィ イ ゥ ウ ェ エ ォ オ カ ガ キ ギ ク グ ケ ゲ コ ゴ サ ザ シ ジ ス ズ セ ゼ ソ ゾ タ ダ チ ヂ ッ ツ ヅ テ デ ト ド ナ ニ ヌ ネ ノ ハ バ パ ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ ボ ポ マ ミ ム メ モ ャ ヤ ュ ユ ョ ヨ ラ リ ル レ ロ ヮ ワ ヲ ン ー A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z 、");

在C#中,将日语片假名半角字符转换全角字符可以通过使用字符编码转换的方法来实现。全角字符通常占用的字符宽度是半角字符的两倍,即每个全角字符占据两个标准字符位置。以下是一个简单的示例方法,用于将包含片假名的字符串中的半角字符转换全角字符: ```csharp using System; class Program { static void Main() { string input = "ABC123"; // 这个字符串中包含全角字符和半角字符 string output = ShiftJISToUnicode(input); // 将输入字符串中的半角片假名转换全角片假名 Console.WriteLine(output); } static string ShiftJISToUnicode(string s) { byte[] bytes = new byte[s.Length * 2]; // 由于全角字符占用空间是半角的两倍,因此创建一个足够大的字节数组 int byteIndex = 0; for (int i = 0; i < s.Length; i++) { char c = s[i]; if (c >= 0x81 && c <= 0x9F) // 判断是否为半角片假名的首字节范围 { c = (char)(c + 0x80); // 将首字节转换全角字符 bytes[byteIndex++] = (byte)(c >> 8); // 高字节 bytes[byteIndex++] = (byte)(c & 0xFF); // 低字节 } else if (c >= 0xE0 && c <= 0xFC) // 判断是否为半角片假名的尾字节范围 { c = (char)(c + 0xC1); // 将尾字节转换全角字符 bytes[byteIndex++] = (byte)(c >> 8); // 高字节 bytes[byteIndex++] = (byte)(c & 0xFF); // 低字节 } else { // 如果字符不是半角片假名,则直接复制到字节数组中 if (char.IsHighSurrogate(c)) { if (i + 1 >= s.Length || !char.IsLowSurrogate(s[++i])) { throw new ArgumentException("输入字符串不是有效的Unicode字符串"); } bytes[byteIndex++] = (byte)(c >> 16); // 高字节 bytes[byteIndex++] = (byte)(c >> 8); // 中字节 bytes[byteIndex++] = (byte)(c & 0xFF); // 低字节 } else if (char.IsLowSurrogate(c)) { throw new ArgumentException("输入字符串不是有效的Unicode字符串"); } else { bytes[byteIndex++] = (byte)(c >> 8); // 单个字符的字节 bytes[byteIndex++] = (byte)(c & 0xFF); // } } } return Encoding.Default.GetString(bytes, 0, byteIndex); // 使用默认编码将字节数组转换回字符串 } } ``` 请注意,这个示例使用了默认编码`Encoding.Default`来转换字节数组为字符串,这取决于你的应用程序运行环境的默认编码。在某些情况下,你可能需要根据实际使用的编码(如Shift_JIS)来进行转换。上述代码仅为示例,实际应用中可能需要进一步的错误处理和优化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值