国际标准之语言编码 - ISO-639

ISO-639-1是两个字母的语言编码,ISO-639-2和ISO-639-3是3个字母的编码。
在我们在软件配置或相关开发时需要对语言进行操作,作为参数或进行识别时,就需要用到这个语言编码了。
ISO639-1主要是用于术语、辞书编纂和语言学,也适用于任何需要以2字母代码形式表示语种的工作领域(尤其是计算机系统)。
ISO639-2不仅包括ISO639-1中的全部语种,也包括ISO639-1以外的语言,同时还包括集合语种,以便当需要更详细编码时能进行特殊目的的编码 。
ISO639-1中列出的语种是ISO639-2中语种的子集,2字母代码中的每个语种代码在3字母代码表中都有对应的代码,但3字母代码中的每个语种代码不一定在2字母代码表中有对应的代码。
这两个语种代码表是开放式的。这些代码一直用于术语、辞书编纂、信息和文献(例如用于图书馆、信息服务和出版社)以及语言学。ISO639-1也包括制定语种代码的指南和一些应用语种代码的方法。
ISO 639-3延伸了 ISO 639-2 里的 Alpha-3 code(三个字母的代号),目标是涵盖所有的语言。
所以,它是 ISO 639-1 的超集合。 
ISO 639-3 是 ISO 639-2 个别语言的超集合,但是因为 ISO 639-3 没有 ISO 639-2 的语言集合,所以 ISO 639-3 不是整个 ISO 639-2 的超集合。
其中有4个代码用来代表特殊情况:
mis──“uncoded languages”(未编码语言);
mul──“multiple languages”(多语种);
und──“undetermined language”(未确定的语种);
zxx──“no linguistic content”。
标准中亦有一个供私人使用的范围: qaa-qtz。
举个例子,汉语在ISO-639-2中是一个语种“zho”。
而在 ISO 639-3 代码中,汉语被分为好几种方言。
ISO-639-1:
CODE
Language Name
中文名
AA
Afar
阿法尔语
AB
Abkhazian
阿布哈兹语
AE
Avestan
阿维斯坦语
AF
Afrikaans
南非语
AK
Akan
阿肯语
AM
Amharic
阿姆哈拉语
AN
Aragonese
阿拉贡语
AR
Arabic
阿拉伯语
AS
Assamese
阿萨姆语
AV
Avaric
阿瓦里语
AY
Aymara
艾马拉语
AZ
Azerbaijani
阿塞拜疆语
BA
Bashkir
巴什基尔语
BE
Belarusian
白俄罗斯语
BG
Bulgarian
保加利亚语
BH
Bihari
比哈里语
BI
Bislama
比斯拉马语
BM
Bambara
班巴拉语
BN
Bengali
孟加拉语
BO
Tibetan
藏语
BR
Breton
布列塔尼语
BS
Bosnian
波斯尼亚语
CA
Catalan, Valencian
加泰罗尼亚语、瓦伦西亚语
CE
Chechen
车臣语
CH
Chamorro
查莫罗语
CO
Corsican
科西嘉语
CR
Cree
克里语
CS
Czech
捷克语
CU
Church Slavic, Old Slavonic, Church Slavonic, Old Bulgarian, Old Church Slavonic
教会斯拉夫语、旧斯拉夫语、教会斯拉夫语、旧保加利亚语、旧教会斯拉夫语
CV
Chuvash
丘瓦士语
CY
Welsh
威尔士语
DA
Danish
丹麦语
DE
German
德文
DV
Divehi, Dhivehi, Maldivian
迪维希语, 迪维希语, 马尔代夫语
DZ
Dzongkha
宗卡语
EE
Ewe
埃维语
EL
Modern Greek
现代希腊语
EN
English
英语
EO
Esperanto
世界语
ES
Spanish, Castilian
西班牙语、卡斯蒂利亚语
ET
Estonian
爱沙尼亚语
EU
Basque
巴斯克语
FA
Persian
波斯语
FF
Fulah
富拉语
FI
Finnish
芬兰语
FJ
Fijian
斐济语
FO
Faroese
法罗语
FR
French
孟加拉语
FY
Western Frisian
西弗里斯兰语
GA
Irish
爱尔兰语
GD
Gaelic, Scottish Gaelic
盖尔语、苏格兰盖尔语
GL
Galician
加利西亚语
GN
Guaraní
瓜拉尼语
GU
Gujarati
古吉拉特语
GV
Manx
马恩岛语
HA
Hausa
豪萨语
HE
Modern Hebrew
现代希伯来语
HI
Hindi
印地语
HO
Hiri Motu
希里莫图语
HR
Croatian
克罗地亚语
HT
Haitian, Haitian Creole
海地语,海地克里奥尔语
HU
Hungarian
匈牙利语
HY
Armenian
亚美尼亚语
HZ
Herero
赫雷罗语
IA
Interlingua (International Auxiliary Language Association)
国际辅助语言协会(Interlingua)
ID
Indonesian
印度尼西亚语
IE
Interlingue, Occidental
英特林格语,西方
IG
Igbo
伊博语
II
Sichuan Yi, Nuosu
四川彝语、诺苏语
IK
Inupiaq
伊努皮亚克语
IO
Ido
伊多语
IS
Icelandic
冰岛语
IT
Italian
孟加拉语
IU
Inuktitut
伊努克语
JA
Japanese
斐济语
JV
Javanese
爪哇语
KA
Georgian
格鲁吉亚语
KG
Kongo
康戈语
KI
Kikuyu, Gikuyu
基库尤语、吉库尤语
KJ
Kwanyama, Kuanyama
昆亚马语,昆亚马语
KK
Kazakh
哈萨克语
KL
Kalaallisut, Greenlandic
Kalaallisut, 格陵兰岛语
KM
Central Khmer
中高棉语
KN
Kannada
卡纳达语
KO
Korean
韩国语
KR
Kanuri
卡努里语
KS
Kashmiri
克什米尔语
KU
Kurdish
库尔德语
KV
Komi
科米语
KW
Cornish
粟特语
KY
Kirghiz, Kyrgyz
柯尔克孜语、吉尔吉斯语
LA
Latin
拉丁语
LB
Luxembourgish, Letzeburgesch
卢森堡语、莱兹堡语
LG
Ganda
甘达语
LI
Limburgish, Limburgan, Limburger
林堡语、林布尔根语、林堡人语
LN
Lingala
林加拉语
LO
Lao
老挝语
LT
Lithuanian
立陶宛语
LU
Luba-Katanga
Luba-Katanga
LV
Latvian
拉脱维亚语
MG
Malagasy
马达加斯加语
MH
Marshallese
马绍尔语
MI
Māori
毛利语
MK / SL
Macedonian
马其顿语
ML
Malayalam
马拉雅拉姆语
MN
Mongolian
蒙古语
MO
Moldavian
摩尔达维亚语
MR
Marathi
马拉地语
MS
Malay
马来语
MT
Maltese
马耳他语
MY
Burmese
缅甸语
NA
Nauru
瑙鲁语
NB
Norwegian Bokmål
挪威语的Bokmål
ND
North Ndebele
北恩德贝勒语
NE
Nepali
尼泊尔语
NG
Ndonga
恩东加语
NL
Dutch, Flemish
荷兰语、弗拉芒语
NN
Norwegian Nynorsk
挪威尼诺斯克语
NO
Norwegian
挪威语
NR
South Ndebele
南恩德贝勒语
NV
Navajo, Navaho
纳瓦霍语、纳瓦霍语
NY
Chichewa, Chewa, Nyanja
奇切瓦语、切瓦语、尼安贾语
OC
Occitan (after 1500)
奥克语(1500年后)
OJ
Ojibwa
奥吉布瓦语
OM
Oromo
奥罗莫语
OR
Oriya
奥里亚语
OS
Ossetian, Ossetic
奥塞梯语,奥塞梯语
PA
Panjabi, Punjabi
潘贾比语、旁遮普语
PI
Pāli
帕利语
PL
Polish
孟加拉语
PS
Pashto, Pushto
普什图语,普什图语
PT
Portuguese
孟加拉语
QU
Quechua
克丘亚语
RM
Romansh
罗曼什语
RN
Rundi
伦迪语
RO
Romanian, Moldavian, Moldovan
罗马尼亚语、摩尔达维亚语、摩尔多瓦语
RU
Russian
刚果语
RW
Kinyarwanda
基尼亚卢旺达语
SA
Sanskrit
梵语
SC
Sardinian
萨丁尼亚语
SD
Sindhi
辛迪语
SE
Northern Sami
北萨米语
SG
Sango
桑戈语
SH
Serbo-Croatian
塞尔维亚-克罗地亚语
SI
Sinhala, Sinhalese
僧伽罗语,僧伽罗人
SK
Slovak
斯洛伐克语
SL
Slovene
斯洛维尼亚语
SM
Samoan
萨摩亚语
SN
Shona
绍纳语
SO
Somali
索马里语
SQ
Albanian
阿尔巴尼亚语
SR
Serbian
塞尔维亚语
SS
Swati
斯瓦提语
ST
Southern Sotho
南索托语
SU
Sundanese
巽他语
SV
Swedish
瑞典语
SW
Swahili
斯瓦希里语
TA
Tamil
孟加拉语
TE
Telugu
泰卢固语
TG
Tajik
塔吉克语
TH
Thai
泰语
TI
Tigrinya
提格里尼亚语
TK
Turkmen
土库曼语
TL
Tagalog
塔加洛语
TN
Tswana
茨瓦纳语
TO
Tonga (Tonga Islands)
汤加语(汤加群岛
TR
Turkish
土耳其语
TS
Tsonga
桑加语
TT
Tatar
鞑靼语
TW
Twi
特维语
TY
Tahitian
塔希提语
UG
Uighur, Uyghur
维吾尔语,维吾尔语
UK
Ukrainian
乌克兰语
UR
Urdu
乌尔都语
UZ
Uzbek
乌兹别克语
VE
Venda
文达语
VI
Vietnamese
孟加拉语
VO
Volapük
孟加拉语
WA
Walloon
瓦隆语
WO
Wolof
刚果语
XH
Xhosa
绍萨语
YI
Yiddish
伊德语
YO
Yoruba
约鲁巴语
ZA
Zhuang, Chuang
壮族、川族
ZH
Chinese
汉语
ZU
Zulu
祖鲁语
ISO-639-2和ISO-639-3:
参考:
百度百科

 

ISO 8859-1,又称Latin-1或“西欧语言”,是国际标准化组织内ISO/IEC 8859的第一个8位字符集。它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入96个字母及符号,藉以供使用附加符号的拉丁字母语言使用。\[1\]ISO-8859-1码是在ASCII码的基础上发展而来的,所以有时也叫扩展ASCII码。与ASCII码相同,它的编码也是占一个字节(8个bit),但与ASCII码不同的时它8个bit位全用到了。ISO-8859-1编码兼容ASCII码,0000 0000~0111 1111仍然是ASCII码的内容。\[2\]在Java中,可以使用String类的getBytes方法将字符串转换为ISO-8859-1编码的字节数组,也可以使用String类的构造函数将ISO-8859-1编码的字节数组转换为字符串。\[3\] #### 引用[.reference_title] - *1* *3* [ISO-8859-1疑问](https://blog.csdn.net/lgh1992314/article/details/78684117)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [搞清楚字符编码03-ISO-8859-1码](https://blog.csdn.net/Sacredness/article/details/89439746)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

夜流冰

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值