甚麼是 ISO 10646 國際編碼標準
為提供一個共通的技術基礎以處理不同語文的電子資料,國際標準化組織 (ISO) 發展了一套名為 ISO 10646 的國際編碼標準。該標準為世界各種主要語文的字符包括繁體及簡體的中文字,編訂統一的內碼。
各種語文的字符各有不同。為了在電腦及電子裝置內處理各地區本身的字符,世界各地採用了不同的編碼標準。例如香港及台灣使用繁體字,通常採用「大五碼」編碼標準。中國內地使用簡體字,通常採用「國標碼」編碼標準。各種不同的編碼標準互不兼容,一個編碼在不同的編碼標準內可能代表不同的字符,導致某一地區發出的電子資訊,在傳送到其他地區的電腦系統時,可能會出現亂碼或某些字符不能正確地顯示等問題。即使可使用轉換編碼的軟件以顯示不同編碼的資料,但這不單費時失事,更未必能完全解決問題。
制訂 ISO 10646 國際編碼標準的目的,便是為了解決上述問題。該編碼標準涵蓋了各種主要語文的字符,包括繁體及簡體的中文字。ISO 10646 國際編碼標準提供了一套統一的字符編碼標準,方便各地的電腦用戶進行電子通訊及資料交換。採用該標準後,世界各地不同的電腦系統之間便能更準確地儲存、處理、傳遞及顯示各種語文的電子資訊,從而加強各地間電子資訊的流通及推動電子交易的進行。
ISO 10646 國際編碼標準的發展情況
國際標準化組織於一九九三年發表 ISO 10646 國際編碼標準的首個版本,全名是「ISO/IEC 10646-1:1993」,並在二零零零年發表了「ISO/IEC 10646-1:2000」。「ISO/IEC 10646-1:2000」是「ISO/IEC 10646-1:1993」的更新版本,它包括了「ISO/IEC 10646-1:1993」內的 20,902 個表意文字及新增收於擴展區 A 的 6,582 個表意文字,即共 27,484 個表意文字。國際標準化組織在二零零一年十一月發表了「ISO/IEC 10646-2:2001」,作為對「ISO/IEC 10646-1:2000」的補充。「ISO/IEC 10646-2:2001」於擴展區 B 新增了 42,711 個表意文字,使 ISO 10646 國際編碼標準所包括的表意文字總數超逾 70,000個,其中包括所有收錄在《康熙字典》、《漢語大字典》和《漢語大詞典》內的漢字。國際標準化組織於二零零四年四月發表了「ISO/IEC 10646:2003」。「ISO/IEC 10646:2003」合併了「ISO/IEC 10646-1:2000」和它的補充版本「ISO/IEC 10646-2:2001」而成為一個單一發行本。因此,「ISO/IEC 10646:2003」內的表意文字與「ISO/IEC 10646-1:2000」附帶「ISO/IEC 10646-2:2001」內的表意文字是相同的。
表意文字是指一些字形與字義具有關係的文字,例如漢字。把表意文字收納在 ISO 10646 國際編碼標準的工作是分三期進行的,即擴展區 A、擴展區 B 及擴展區 C 等三個階段。擴展區 A 及擴展區 B已分別隨「ISO/IEC 10646-1:2000」及「ISO/IEC 10646-2:2001」獲得發表。至於擴展區C的工作計劃,國際標準化組織會在稍後時間決定。
國際標準化組織及 Unicode 學術學會維持 ISO 10646 國際編碼標準及統一碼的同步發展。有關 ISO 10646 國際編碼標準 / 統一碼的收字資料,請參閱 Unicode 學術學會的網頁 http://www.unicode.org/charts/。
ISO 10646 的表意文字
表意文字是指一些字形與字義具有關係的文字。ISO 10646則是指由國際標準化組織 (ISO) 所發展的一套國際編碼標準。該標準把所有中文字符及其他語言(例如日語的 Kanzi 和韓語的 Hanja)中近似中文的字符統稱為漢字。
ISO 10646 國際編碼標準的漢字被劃分入三個主要編碼區,即中日韓表意文字區、中日韓表意文字區擴展區 A 及中日韓表意文字區擴展區 B