Java判断UTF-8串字符数量

最新推荐文章于 2024-06-17 18:07:51 发布

愛在梦醒时分

最新推荐文章于 2024-06-17 18:07:51 发布

阅读量1k

点赞数 2

分类专栏：数据结构/算法文章标签： utf-8 算法

本文链接：https://blog.csdn.net/h843653844/article/details/95821666

版权

这是一篇关于如何在Java中计算UTF-8编码字符串字符数量的文章。题目来源于一次面试，通过遍历字符数组并判断每个字符的字节长度来统计。由于Java的byte类型是带符号的，所以需要将byte转换为无符号16进制数再进行比较。文中提供了改进后的Java代码实现。

摘要由CSDN通过智能技术生成

前几天作业帮面试的一道编程题，题目要求，给定一个UTF-8编码的字符串(字符数组的形式)，返回该字符串的字符数量。
UTF-8编码介绍：
UTF-8编码中一个字符的长度为1-6个字节，其中，该字符的长度在第一个字节（byte）的前1-6位有表示，具体如下：
在这里插入图片描述有了以上参考资料大体就有思路了，那就是遍历字符数组统计每个字符的长度，然后将i+字符长度-1，判断字符长度的时候，直接将byte与二进制的0b11111100,0b11111000,0b11110000,0b11100000,0b11000000比较就可以，但是java 的byte范围是-128~+127，是一个有符号数，和0 ~ 255的正整数比较起来实现起来有些困难，我当时在有限的时间内没有想到解决办法，回来之后重新理了理思路，整理了一下java的解法。
主要改进的地方是统计字符个数的时候，先将有符号的byte转化为了一个16进制的无符号数（String表示的），然后将其转化为int型再去比较。
实现代码如下：

import java.io.UnsupportedEncodingException;

public class GetUtf_8_Length {

	private static int getcharnum(byte[] bytes) {
		int count=0;
		for(int i=0;i<bytes.length;i++) {
			int len=getcharlen(b

最低0.47元/天解锁文章

愛在梦醒时分

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Java判断UTF-8串字符数量

前几天作业帮面试的一道编程题，题目要求，给定一个UTF-8编码的字符串(字符数组的形式)，返回该字符串的字符数量。UTF-8编码介绍：UTF-8编码中一个字符的长度为1-6个字节，其中，该字符的长度在第一个字节（byte）的前1-6位有表示，具体如下：有了以上参考资料大体就有思路了，那就是遍历字符数组统计每个字符的长度，然后将i+字符长度-1，判断字符长度的时候，直接将byte与二进制的0b...
复制链接

扫一扫

专栏目录