C# .net 汉字:字符串截取、补齐

在代码中,一个汉字length=1,但是占用2个字符。

若想截取或者补齐的话,字符串中包含汉字取length是不一定准确的,虽然大多数情况下没有问题。

如下代码可以解决问题,已验证。

private string cutSubstring(string str, int length)
{
    if (str == null || str.Length == 0 || length < 0)
    { 
        return ""; 
    }

    byte[] bytes = System.Text.Encoding.Unicode.GetBytes(str);
    int n = 0;  //  表示当前的字节数
    int i = 0;  //  要截取的字节数
    for (; i < bytes.GetLength(0) && n < length; i++)
    {
        //  偶数位置,如0、2、4等,为UCS2编码中两个字节的第一个字节
        if (i % 2 == 0)
        {
            n++;      //  在UCS2第一个字节时n加1
        }
        else
        {
            //  当UCS2编码的第二个字节大于0时,该UCS2字符为汉字,一个汉字算两个字节
            if (bytes[i] > 0)
            {
                n++;
            }
        }
    }
    //  如果i为奇数时,处理成偶数
    if (i % 2 == 1)
    {
        //  该UCS2字符是汉字时,去掉这个截一半的汉字
        if (bytes[i] > 0)
            i = i - 1;
        //  该UCS2字符是字母或数字,则保留该字符
        else
            i = i + 1;
    }
    return System.Text.Encoding.Unicode.GetString(bytes, 0, i);
}
private string retrunStr(string strvalue, int len)
{
	//string values=strvalue.PadLeft(len);
	//string values=strvalue.PadRight(len);
	
	string values="";
	int tmplen=System.Text.RegularExpressions.Regex.Replace(strvalue, @"[^\x00-\xff]", "aa").Length;//计算得到该字符串对应单字节字符串的长度
	if (tmplen<=len)
	{
		values=strvalue.PadRight(len - tmplen + strvalue.Length);
	}
	else
	{
		strvalue=cutSubstring(strvalue,len);
		values=strvalue.PadRight(len - tmplen + strvalue.Length);
	}
	
	return values;
}

调用 retrunStr(传入字符串,长度) 即可。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值