native2ascii命令

native2ascii的命令行的命名格式: 

native2ascii -[options] [inputfile [outputfile]] 

Unicode转GBK:

native2ascii -reverse -encoding GBK application.properties>test.properties

转Unicode:

native2ascii a.txt b.txt 

因为java默认是unicode编码,故可略写

说明: 
-[options]:表示命令开关,有两个选项可供选择 
-reverse:将Unicode编码转为本地或者指定编码,不指定编码情况下,将转为本地编码。 
-encoding encoding_name:转换为指定编码,encoding_name为编码名称。 

[inputfile [outputfile]] 
inputfile:表示输入文件全名。 
outputfile:输出文件名。如果缺少此参数,将输出到控制台。 

------------------------------------------------------------- 

Converter        Description 
Class 
------------------------------------------------------------- 

8859_1           ISO 8859-1 
8859_2           ISO 8859-2 
8859_3           ISO 8859-3 
8859_4           ISO 8859-4 
8859_5           ISO 8859-5 
8859_6           ISO 8859-6 
8859_7           ISO 8859-7 
8859_8           ISO 8859-8 
8859_9           ISO 8859-9 
Big5             Big5, Traditional Chinese 
CNS11643         CNS 11643, Traditional Chinese 
Cp037            USA, Canada(Bilingual, French), Netherlands, Portugal, Brazil, Australia 
Cp1006           IBM AIX Pakistan (Urdu) 
Cp1025           IBM Multilingual Cyrillic: Bulgaria, Bosnia, Herzegovinia, Macedonia(FYR) 
Cp1026           IBM Latin-5, Turkey 
Cp1046           IBM Open Edition US EBCDIC 
Cp1097           IBM Iran(Farsi)/Persian 
Cp1098           IBM Iran(Farsi)/Persian (PC) 
Cp1112           IBM Latvia, Lithuania 
Cp1122           IBM Estonia 
Cp1123           IBM Ukraine 
Cp1124           IBM AIX Ukraine 
Cp1125           IBM Ukraine (PC) 
Cp1250           Windows Eastern European 
Cp1251           Windows Cyrillic 
Cp1252           Windows Latin-1 
Cp1253           Windows Greek 
Cp1254           Windows Turkish 
Cp1255           Windows Hebrew 
Cp1256           Windows Arabic 
Cp1257           Windows Baltic 
Cp1258           Windows Vietnamese 
Cp1381           IBM OS/2, DOS People's Republic of China (PRC) 
Cp1383           IBM AIX People's Republic of China (PRC) 
Cp273            IBM Austria, Germany 
Cp277            IBM Denmark, Norway 
Cp278            IBM Finland, Sweden 
Cp280            IBM Italy 
Cp284            IBM Catalan/Spain, Spanish Latin America 
Cp285            IBM United Kingdom, Ireland 
Cp297            IBM France 
Cp33722          IBM-eucJP - Japanese (superset of 5050) 
Cp420            IBM Arabic 
Cp424            IBM Hebrew 
Cp437            MS-DOS United States, Australia, New Zealand, South Africa 
Cp500            EBCDIC 500V1 
Cp737            PC Greek 
Cp775            PC Baltic 
Cp838            IBM Thailand extended SBCS 
Cp850            MS-DOS Latin-1 
Cp852            MS-DOS Latin-2 
Cp855            IBM Cyrillic 
Cp857            IBM Turkish 
Cp860            MS-DOS Portuguese 
Cp861            MS-DOS Icelandic 
Cp862            PC Hebrew 
Cp863            MS-DOS Canadian French 
Cp864            PC Arabic 
Cp865            MS-DOS Nordic 
Cp866            MS-DOS Russian 
Cp868            MS-DOS Pakistan 
Cp869            IBM Modern Greek 
Cp870            IBM Multilingual Latin-2 
Cp871            IBM Iceland 
Cp874            IBM Thai 
Cp875            IBM Greek 
Cp918            IBM Pakistan(Urdu) 
Cp921            IBM Latvia, Lithuania (AIX, DOS) 
Cp922            IBM Estonia (AIX, DOS) 
Cp930            Japanese Katakana-Kanji mixed with 4370 UDC, superset of 5026 
Cp933            Korean Mixed with 1880 UDC, superset of 5029 
Cp935            Simplified Chinese Host mixed with 1880 UDC, superset of 5031 
Cp937            Traditional Chinese Host miexed with 6204 UDC, superset of 5033 
Cp939            Japanese Latin Kanji mixed with 4370 UDC, superset of 5035 
Cp942            Japanese (OS/2) superset of 932 
Cp948            OS/2 Chinese (Taiwan) superset of 938 
Cp949            PC Korean 
Cp950            PC Chinese (Hong Kong, Taiwan) 
Cp964            AIX Chinese (Taiwan) 
Cp970            AIX Korean 
EUCJIS           JIS, EUC Encoding, Japanese 
GB2312           GB2312, EUC encoding, Simplified Chinese 
GBK              GBK, Simplified Chinese 
ISO2022CN        ISO 2022 CN, Chinese 
ISO2022CN_CNS    CNS 11643 in ISO-2022-CN form, T. Chinese 
ISO2022CN_GB     GB 2312 in ISO-2022-CN form, S. Chinese 
ISO2022KR        ISO 2022 KR, Korean 
JIS              JIS, Japanese 
JIS0208          JIS 0208, Japanese 
KOI8_R           KOI8-R, Russian 
KSC5601          KS C 5601, Korean 
MS874            Windows Thai 
MacArabic        Macintosh Arabic 
MacCentralEurope Macintosh Latin-2 
MacCroatian      Macintosh Croatian 
MacCyrillic      Macintosh Cyrillic 
MacDingbat       Macintosh Dingbat 
MacGreek         Macintosh Greek 
MacHebrew        Macintosh Hebrew 
MacIceland       Macintosh Iceland 
MacRoman         Macintosh Roman 
MacRomania       Macintosh Romania 
MacSymbol        Macintosh Symbol 
MacThai          Macintosh Thai 
MacTurkish       Macintosh Turkish 
MacUkraine       Macintosh Ukraine 
SJIS             Shift-JIS, Japanese 
UTF8             UTF-8 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
引用:那么既然都已经推出了 unicode 统一编码字符集,为什么不统一全部使用 ucs-2/utf-16 编码呢?这是因为其实对于英文使用国家来说,字符基本上都是 ASCII 字符,使用 utf-8 编码一个字节代表一个字符很常见,如果使用 ucs-2/utf-16 编码反而会浪费空间。 引用:这段代码的核心就是我们上面提到的 utf-8 和 utf-16 转换的公式。我们详细解析一下这个函数,先假设传递过来的字符串是“a中文”,对应 utf-8 编码十六进制是 “0x610xE40xB80xAD0xE60x960x87”,转换步骤如下: 引用:发现了么?dalvik 代码中并没有对 4 字节 utf-8 编码的字符串进行处理,而 ART 中专门用了很详细的注释说明了针对 4 字节编码的 utf-8 需要转成代理对(surrogate pair)!为什么之前 Android 版本没有针对 4 字节编码进行处理?我的一个推测是:可能老版本的 Android 系统使用的是 ucs-2 编码,并没有对 BMP 之外的平面集做处理,所以也不存在 4 字节的 utf-8,在扩展为 utf-16 编码之后,自然而然就需要额外对 4 字节的 utf-8 进行转换成代理对的操作。 Hash'native2ascii' 不是内部或外部命令,也不是可运行的程序或批处理文件。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Android Native 开发之 NewString 与 NewStringUtf 解析](https://blog.csdn.net/u201011221/article/details/112590839)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值