今天想获取中文首字母,网上一搜基本都是python2的脚本,试了几个不行,只得在原有脚本基础上改改。
python2的如下脚本在python3上运行是不能通过的
asc = ord(str1[0]) * 256 + ord(str1[1]) - 65536
经过反复思考查证,最终解决了这个问题,现附上思考过程:
就是酱紫。所以下边附上python3支持的获取中文首字母的方法
def single_get_first(unicode1):
str1 = unicode1.encode('gbk')
try:
ord(str1)
return str1
except:
asc = str1[0] * 256 + str1[1] - 65536
if asc >= -20319 and asc <= -20284:
return 'a'
if asc >= -20283 and asc <= -19776:
return 'b'
if asc >= -19775 and asc <= -19219:
return 'c'
if asc >= -19218 and asc <= -18711:
return 'd'
if asc >= -18710 and asc <= -18527:
return