Linux乱码转换（一）

最新推荐文章于 2024-04-29 13:32:26 发布

ctsu9014

最新推荐文章于 2024-04-29 13:32:26 发布

阅读量468

点赞数

文章标签：操作系统大数据数据库

带有中文的文件传到Linux服务器，打开后，看到的全是windows乱码。下面介绍如何将在Linux环境下打开中文字符文件，而不出现乱码。
1）载window下查看文件： Hadoop权威指南.txt

在这本《Hadoop权威指南(第3版)》即将出版之际，我十分高兴地再次向广大读者推荐这本书。
　　一本书的价值最重要的是取决于它的用途。今天，开源的Hadoop已经成为研究大数据十分重要的平台，
在我国已经形成一个庞大的Hadoop用户社群，他们对学习、掌握和提高Hadoop提出了很高的需求，
《Hadoop权威指南(第3版)》恰好满足这样的需要，其用途和价值不言而喻。这一点也可以从下面的事实中得到佐证：
从2011年年底出版至今，本书的第2版已经实现了12次印刷，拥有近3.5万名读者并连续两年位列专业图书畅销榜榜首。
　　一本书的价值还来自于它的内容。原著是用英文写作的，它的内容组织得当，思路清晰，紧密结合实际。
但是要把它翻译成中文介绍给中国的读者，并非易事。它不单单要求译者能够熟练地掌握英文，还要求他们对
书中的技术性内容有深入、准确的了解和掌握。从这两点来审视，本书的译者团队完全足以胜任。作为大学老师，
他们不仅在大数据领域从事一线教学和科研，同时还负责指导研究生从事数据库方面的研究。从 2006 年开始，
他们就在计算机集群上部署了Hadoop并成功完成了很多项研究。在这几年的工作过程中，他们对Hadoop及其应用
开发有着深入的理解和认识，这是本书翻译质量有保证的重要前提。
　　经过再一次升级、修订和更新，值此《Hadoop权威指南(第3版)》出版之际，我衷心地希望这本书继续为广
大读者带来更高的学习价值，更友好的阅读体验。

2）强中文件字符文件 AA乱码.txt 上传至Linux服务器，放在 /root/demo下。

3）#cat Hadoop权威指南.txt
??????Hadoop??????(??3??)??????????????????????????????????????????顣
?????????????????????????????????????????????Hadoop???????о???????????????????
?????????γ?????????Hadoop??????????????????????????Hadoop????????????
??Hadoop??????(??3??)???????????????????????????????????????????????????????????е???????
??2011??????????????????????2??????????12????????н?3.5?????????????????λ??????鳩?????????
????????????????????????????????????????д??????????????????????·?????????????????
????????????????????????й?????????????????????????????????????????????????????????
???е???????????????????????????????????????????????????????????????????Ρ????????????
???????????????????????????????У?????????????о?????????????????о????? 2006 ?????
??????????????????????Hadoop????????????????о???????????????????У??????Hadoop??????
???????????????????????????????鷭???????б??????????
????????????????????????????????Hadoop??????(??3??)??????????????????????????????
?????????????????????????????????顣

4）查看文件编码类型 file Hadoop权威指南.txt
#file Hadoop权威指南.txt
Hadoop权威指南.txt: ISO-8859 text, with CRLF line terminators

5）查看系统字符集设置
# echo $LANG
en_US.UTF-8

编码为UTF-8

6）下面就将 Hadoop权威指南.txt 转换为 UTF-8

由第 4）步看到文件的类型为 ISO-8859，其实在windows中文字符实际为GBK

所以可以进行如下转换：
# iconv -f GBK -t UTF-8 Hadoop权威指南.txt -o Hadoop权威指南_UTF8.txt
iconv: 无法打开输入文件“Hadoop权威指南.txt”: 没有那个文件或目录
报错
以上报错说明iconv无法识别文件名
我们还需要把文件名转换一下。
可以使用工具convmv
执行如下：
# convmv -f GBK -t UTF-8 --notest Hadoop权威指南.txt
Skipping, already UTF-8: ./Hadoop权威指南.txt
Ready!

然后再执行如上命令文件内容转换命令
# iconv -f GBK -t UTF-8 Hadoop权威指南.txt -o Hadoop权威指南_UTF8.txt ##无结果回显
查看转码后的文件内容，如下：

# cat Hadoop权威指南_UTF8.txt
在这本《Hadoop权威指南(第3版)》即将出版之际，我十分高兴地再次向广大读者推荐这本书。
　　一本书的价值最重要的是取决于它的用途。今天，开源的Hadoop已经成为研究大数据十分重要的平台，
在我国已经形成一个庞大的Hadoop用户社群，他们对学习、掌握和提高Hadoop提出了很高的需求，
《Hadoop权威指南(第3版)》恰好满足这样的需要，其用途和价值不言而喻。这一点也可以从下面的事实中得到佐证：
从2011年年底出版至今，本书的第2版已经实现了12次印刷，拥有近3.5万名读者并连续两年位列专业图书畅销榜榜首。
　　一本书的价值还来自于它的内容。原著是用英文写作的，它的内容组织得当，思路清晰，紧密结合实际。
但是要把它翻译成中文介绍给中国的读者，并非易事。它不单单要求译者能够熟练地掌握英文，还要求他们对
书中的技术性内容有深入、准确的了解和掌握。从这两点来审视，本书的译者团队完全足以胜任。作为大学老师，
他们不仅在大数据领域从事一线教学和科研，同时还负责指导研究生从事数据库方面的研究。从 2006 年开始，
他们就在计算机集群上部署了Hadoop并成功完成了很多项研究。在这几年的工作过程中，他们对Hadoop及其应用
开发有着深入的理解和认识，这是本书翻译质量有保证的重要前提。
　　经过再一次升级、修订和更新，值此《Hadoop权威指南(第3版)》出版之际，我衷心地希望这本书继续为广
大读者带来更高的学习价值，更友好的阅读体验。

以上即为在linux环境下中文内容文件的显示。

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/9606353/viewspace-1975971/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/9606353/viewspace-1975971/