常见Unicode编码范围

最新推荐文章于 2024-08-20 14:21:59 发布

落叶Ex

最新推荐文章于 2024-08-20 14:21:59 发布

阅读量1.8w

点赞数 9

分类专栏：编程基础文章标签：字符编码

本文链接：https://blog.csdn.net/ccw0054/article/details/79082371

版权

编程基础专栏收录该内容

4 篇文章 0 订阅

订阅专栏

常见Unicode编码范围

经常我们会用到判断某个字符或者字符串是否包含中文，英文，特殊符号等等。这时候可以通过判断Unicode所在区间来确定某个字符所处类型。当然可以通过直接判断Unicode码，但是鉴于习惯，以下提供的是Unicode码对应的数字区间。毕竟字符的本质也就是通过二进制进行存储编码的而已。

汉字：[0x4e00,0x9fa5]（或十进制[19968,40869]）
数字：[0x30,0x39]（或十进制[48, 57]）
小写字母：[0x61,0x7a]（或十进制[97, 122]）
大写字母：[0x41,0x5a]（或十进制[65, 90]）
其他：除上所有

例如：

/**
 * 是否包含汉字
 */
fun String.isContainChinese(): Boolean {
    this.forEach {
        val c = it.toInt()
        if (c in 19968..40868) {
            return true
        }
    }
    return false
}

【转载】Unicode和ASCII的区别

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

落叶Ex

关注关注

9
点赞
踩
26

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Unicode编码范围

thomashtq的专栏

09-05

1万+

引言 unicode是全世界统一的编码规则，但只规定了各种字符的数字编码（相当于一种标准），具体实现的存储方式有utff-8,utf-16,utf-32等形式,各种形式有不同的存储和与unicode代码的映射规则。所以utf8其实不是一种单独的编码规则，只是unicode 的一种存储规则，也是unicode的一种，是变长的。中文字符范围 Unicode CJK 的范围分布在多个

Unicode 编码范围表

清流弯弯

08-07

3175

文字部分（ U+0000 – U+007F）基本拉丁字符（ U+0080 – U+00FF）增补拉丁字符集 1 （ U+0100 – U+017F）拉丁字符扩展集 A （ U+0180 – U+024F）拉丁字符扩展集 B （ U+0370 – U+03FF）希腊文字中的科普特字符（ U+0370 – U+03FF）希腊字符（

1 条评论您还未登录，请先登录后发表或查看评论

字符编码方案：Unicode

08-20

2616

Unicode（统一码、万国码、单一码）是一种在计算机上广泛使用的字符编码，旨在解决传统字符编码方案的局限，为每种语言中的每个字符设定了统一且唯一的二进制编码，以满足跨语言、跨平台进行文本转换和处理的需求。

正则相关

且学且进步

10-24

669

unicode编码范围：汉字：[0x4e00,0x9fa5]（或十进制[19968,40869]）数字：[0x30,0x39]（或十进制[48, 57]）小写字母：[0x61,0x7a]（或十进制[97, 122]）大写字母：[0x41,0x5a]（或十进制[65, 90]）

unicode编码范围

weixin_50582284的博客

06-14

4104

Unicode 编码范围

weixin_30457065的博客

06-11

339

目录所有字符文字部分（ U+0000 – U+007F）基本拉丁字符（ U+0080 – U+00FF）增补拉丁字符集 1 （ U+0100 – U+017F）拉丁字符扩展集 A （ U+0180 – U+024F）拉丁字符扩展集 B （ U+0370 – U+03FF）希腊文字中的科普特字符（...

全部语言Unicode范围

08-10

语言unicode范围整理，国家unicode范围

各国文字Unicode编码范围

06-09

以下是一些主要语言的Unicode编码范围： 1. **英文**： - Unicode范围：0041-005A（大写）, 0061-007A（小写）；如果包含数字和符号，范围是0021-007E。 - ANSI编码是基于ASCII的，对于英文来说，与Unicode基本...

Unicode编码表.zip

08-06

Unicode编码表是一个重要的标准，它在全球范围内统一了字符的表示方式，使得各种语言的文字能够被计算机系统正确地处理和显示。Unicode，也被称为万国码或统一码，是由Unicode联盟制定的一种字符编码标准，旨在解决...

Unicode编码大揭秘

10-25

Unicode编码是一种用于统一编码世界上各种文字字符的标准，它旨在解决传统编码系统中存在的字符集和编码不统一的问题。字符集是一组字符的集合，而编码则是将这些字符与特定的二进制代码对应起来。Unicode的出现是...

Unicode字符编码范围

07-19

Unicode字符编码范围，希望对你有用！

python的unicode编码表_Python-编码

weixin_33212486的博客

12-23

8450

字符编码的常用种类介绍第一种：ASCII码ASCII(American Standard Code for Information Interchange，美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统，并等同于国际标准ISO/IEC 646。如下图所示：由于计算机是美国人发明的，因此，最早只有127个字母被编码到计算机里...

Unicode 编码范围和中文编码范围

兄弟联盟工作室的专栏

04-27

6379

首先将，unicode是全世界统一的编码规则，但是这个只规定了各种字符的数字编码（相当于一种标准），具体实现的存储方式有utff-8,utf-16,utf-32等形式。各种形式有不同的存储和与unicode代码的映射规则。所以utf8其实不是一种单独的编码规则，只是unicode 的一种存储规则，也是unicode的一种，是变长的。 Unicode CJK 的范围分布在多个区段中，带

Unicode汉字、英文字母、数字的unicode范围

04-20

8172

汉字：[0x4e00,0x9fa5]（或十进制[19968,40869]）数字：[0x30,0x39]（或十进制[48, 57]）小写字母：[0x61,0x7a]（或十进制[97, 122]）大写字母：[0x41,0x5a]（或十进制[65, 90]

中文汉字和常见英文数字等的unicode编码范围

aiyanyu5396的博客

05-10

1752

字符集字数 Unicode编码(\u) 基本汉字 20902字 4E00-9FA5 基本汉字补充 38字 9FA6-9FCB 扩展A 6582字 3400-4DB5 扩展B 42711字 20000-2A6D6 扩展C 4149字 2A700-2B734 扩展D 2...

unicode

TaylorChyi的博客

04-24

3393

Unicode 是一种字符集，用于表示和处理世界上大多数书面语言中的文本。在 Unicode 中，英文字符的编码范围在 U+0020 到 U+007E 之间，包括了英文字母、数字、标点符号以及一些其他特殊字符。请注意，Unicode 字符集包含了许多其他字符，不仅仅是英文字符。它包括了其他语言的字符、表情符号、数学符号等等。这些数字的 Unicode 编码从 U+0030（数字 0）开始，依次递增到 U+0039（数字 9）。这些字符主要包括一些特殊字符和标点符号，以及英文大小写字母的分界点。

unicode字符集编码

yeyehenzui的博客

11-03

719

4. UTF-16编码：将字符编码成2字节或者4字节(UTF-8一个代码单元为一个字节，UTF-16一个代码单元为两个字节)