python的chr()和ord()可以帮助我们把复杂的文字变为简约的数字
网上有许多关于Unicode的对照表比如这个↓这张表是2014年的
这里的CJK就是汉字的各种东西~~(包括笔画、繁体等)~~,而CJK同一表意符号就是简体汉字
我简单的在Python命令行简单试了一下,上面标的起始为19968,结束为40895
我们就用一个for循环来看看那里开始不是汉字的
在这里,从40960开始不再是我们认知中的汉字,我们就把40959定位简体汉字编号的结尾
所以,最终,我们求到,40959为简体汉字编号的结尾
(注:这里求证的是在python3.11下运行的,其他版本可能略有不同)
最后求大家一个赞,一个关注,一个收藏~~ ~~