matlab utf8,osx – MATLAB:如何从文件中显示UTF-8编码的文本?

本文介绍了如何在MATLAB中读取并显示UTF-8编码的文本。通过调整字符集和使用特定的Java Swing组件,可以成功地在MATLAB环境中处理和展示非ASCII字符。
摘要由CSDN通过智能技术生成

在做一些挖掘之后,我下面介绍我的发现…考虑这些测试文件:

a.txt

ΓΔΘΛΞΠΣΦΩαβγδεζηθικλμνξπρςστυφχψω

b.txt

தமிழ்

首先,我们读取文件:

%# open file in binary mode, and read a list of bytes

fid = fopen('a.txt', 'rb');

b = fread(fid, '*uint8')'; %'# read bytes

fclose(fid);

%# decode as unicode string

str = native2unicode(b,'UTF-8');

如果你尝试打印字符串,你会得到一堆废话:

>> str

str =

尽管如此,str确保了正确的字符串。我们可以检查每个字符的Unicode代码,这可以在ASCII范围之外看到(最后两个是不可打印的CR-LF行结尾):

>> double(str)

ans =

Columns 1 through 13

915 916 920 923 926 928 931 934 937 945 946 947 948

Columns 14 through 26

949 950 951 952 953 954 955 956 957 958 960 961 962

Columns 27 through 35

963 964 965 966 967 968 969 13 10

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值