java分割汉字_Java分割中英文，并且中文不能分割一半？

最新推荐文章于 2021-03-11 19:05:20 发布

雨前羽街

最新推荐文章于 2021-03-11 19:05:20 发布

阅读量866

点赞数

文章标签： java分割汉字

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30467861/article/details/114074849

版权

本文介绍了如何编写一个Java函数，根据字节数截取字符串，确保汉字不会被分割成一半。函数首先判断字符串编码，然后检查最后一个字符是否为中文，如果不是则直接分割；若是中文，则通过字节数统计和求模来正确截取字符串。代码示例展示了在GBK编码下，如何避免中文被分割的情况。

摘要由CSDN通过智能技术生成

最近准备入其他坑位。在面试过程中，遇到下面这题笔试题，拿出来分享分享。

题目：编写一个截取字符串的函数，输入为一个字符串和字节数，输出为按字节截取的字符串。但是要保证汉字不被截半个，如“我ABC”4，应该截为“我AB”，输入“我ABC汉DEF”，6，应该输出为“我ABC”而不是“我ABC+汉的半个”。

思路：每个文件编码格式不一致，如UTF-8、GBK等。其中，UTF-8 中文用三个字节表示，GBK 中文用两个字节表示。并且中文的字节是负数的。可以根据这个原理，把字符串转化为字节数组，判断最后字符是否为中文。如果是英文，则直接分割返回。否则，循环遍历字节数组，并作相应的负数统计并进行求模。

代码实现：

package com.geshanzsq;

import java.io.UnsupportedEncodingException;

/**

* @author geshanzsq

*/

public class SubString {

public static void main(String[] args) throws UnsupportedEncodingException {

String srcStr1 = "我ABC";

String srcStr2 = "我ABC汉的DEF";

splitString(srcStr1, 4);

splitString(srcStr2, 6);

}

public static void split

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。