erlang的汉字字符串和二进制的相互转换,并还原成汉字打印

1> Hanzi = <<”汉字”/utf8>>.
<<230,177,137,229,173,151>>
2> io:format(“~ts”,[Hanzi]).
汉字ok
3> io:format(“~w”,[Hanzi]).
<<230,177,137,229,173,151>>ok
22> unicode:characters_to_binary(“中国”).
<<228,184,173,229,155,189>>


结论:

中文字符,在Erlang的存储方式,可以是List,也可以是Binary。

如果以List方式存储,即将中文字符,转为Unicode编码(长整数格式);

如果以Binary方式存储,即将中文字符,转为UTF-8编码。

至于Unicode与UTF-8的区别,简单来说,Unicode是一个码表,UTF-8是Unicode编码的一种表示方法。具体的区别,大家可问下谷歌或度娘。

例子:

start() ->
Str = “中国”,
io:format(“Unicode list is: ~p~n”, [Str]),
Bin = unicode:characters_to_binary(Str),
io:format(“Unicode binary is: ~p~n”, [Bin]),
Str1 = unicode:characters_to_list(Bin, utf8),
io:format(“utf8 binary to list is: ~p~n”, [Str1]).

输出结果:

Eshell V6.4 (abort with ^G)
(andy1@pc.com)1> Unicode list is: [20013,22269]
(andy1@pc.com)1> Unicode binary is: <<228,184,173,229,155,189>>
(andy1@pc.com)1> utf8 binary to list is: [20013,22269]
(andy1@pc.com)1>

其中用到了unicode库函数,如果使用普通的erlang:list_to_binary或erlang:binary_to_list,会有编码问题。

在开发过程中,使用的一些第三方库,对中文支持或多或少都有些问题,各位按照此规则调试,可以解决。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,以下是一个从文件中读取字符串并将其转换二进制字符串Erlang示例代码: ``` -module(file_example). -export([read_file/1]). read_file(FileName) -> {ok, IoDevice} = file:open(FileName, [read]), read_lines(IoDevice, <<>>), % 初始值为一个空二进制字符串 file:close(IoDevice). read_lines(IoDevice, Content) -> case io:get_line(IoDevice, "") of eof -> Content; Line -> % 将字符串转换二进制字符串 BinaryLine = list_to_binary(Line), read_lines(IoDevice, <<Content/binary, BinaryLine/binary>>) end. ``` 该函数首先使用`file:open/2`函数打开文件,然后循环读取文件中的每一行,将每一行字符串转换二进制字符串,并将其附加到一个初始值为空的二进制字符串中。最后,函数返回这个二进制字符串。 在`read_lines/2`函数中,我们使用`io:get_line/2`函数来读取文件中的每一行。读取到的每一行都是一个字符串类型,我们需要将其转换二进制字符串类型,以便于后续处理。我们使用`list_to_binary/1`函数将字符串转换二进制字符串。 注意,在将二进制字符串附加到`Content`变量时,我们使用了`<<Content/binary, BinaryLine/binary>>`的语法,它表示将两个二进制字符串拼接在一起。这个语法可以让我们更有效地将二进制字符串连接在一起。 你可以将上面的代码保存到一个名为`file_example.erl`的文件中,并在Erlang Shell中加载和运行它。例如,如果你在Erlang Shell中输入以下命令,它将读取文件`test.txt`中的字符串,并将其输出为二进制字符串: ``` 1> c(file_example). {ok,file_example} 2> file_example:read_file("test.txt"). <<"hello world\nthis is a test.\n">> ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值