普通話首頁 | 輕鬆學普通話 | 普通話水平測試 | 普通話輸入法 | 拼音大師 | 網上交流

  

拼音與字元


       漢語拼音方案

       漢語拼音鍵盤標準

       漢語拼音電腦字元

       免費漢語拼音字型

 

 

 

 

 

 

 

 

 

 

 





 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 










漢字擴展內碼規範 -- GBK 的目的是解決漢字收字不足、簡繁同平面共存、簡化代碼體系間轉換等漢字信息交換的瓶頸問題,並在保持已有應用軟件兼容性的前提下,向最終的國際統一雙字節字符集標準 ISO10646.1 邁進。

1.擴展的漢字內碼規範的原則
與《信息交換用漢字編碼字符集--基本集》即國家標準 GB2312-80 的內碼體系標準完全兼容。在字彙一級支持 ISO 10466.1/《CJK統一漢字編碼字符集》即國家標準 GB13000.1的全部 CJK 漢字。非漢字符號同時涵蓋大部分常用的《BIG5》非漢字符號。

2.規範的名稱與簡稱
中文名稱:漢字內碼規範
英文名稱:Chinese Internal Code Specification
簡稱:GBK ( K是“擴展”的漢語拼音第一個字母) 

3.規範的內容
適用範圍:
作為非 UCS (ISO 10646) 體系的代碼頁(Code Page),適用於中文信息的處理、交換、存儲、顯現、輸入和輸出。

字彙:
•GB2312-80的全部漢字、非漢字符號。
•GB13000.1中的其他CJK漢字。
以上兩項合計為 20902 個 GB 化漢字。

•《簡化字總表》中尚未收入 GB 13000.1 的 52 個漢字;即,GBK 不但能包括《現代漢語通用
     字表》的全部七千個漢字,還能夠包含《簡化字總表》中的全部簡體字及其對應的繁體字。
•《康熙字典》及《辭海》中尚未收入 GB 13000.1 的部首及重要構件共 28 個。
•13 個漢字結構符。
•《BIG5》中未被 GB2312--80 收入的、單在 ISO 10646.1 中存在的圖形符號 139 個。
•正式收入帶音調的拼音字母 30 個和 (按 GB 12345-90 印刷本)。
•漢字“O”(GB13001.1代碼 0x3007“零”)。
•GB 12345-90 中編碼的豎排標點符號 19 個,但凡是 UCS 中沒有編碼的暫不收入。
•從 ISO 10646.1/GB 13000.1 的 CJK 兼容區挑選出來的 21 個漢字,以保證若干 BIG5 
    (TCACNS11643) 文件、JIS 文件及 IBM 文件在雙向往返轉換中不致丟失信息。
•31 個 IBM OS/2 專用符號,凡是 ISO 10646.1/GB 13000.1 已經收入的全部收入或認同。

漢字字序
•GB2312-80 的漢字仍然按照原有的 I 級字,II 級字,分別按拼音、部首/筆劃排列。
•GB13000.1 的其他CJK漢字,按 UCS 代碼大小順序排列。
•追加的80個漢字、部首/構件,與上述兩類字彙分開,按康熙字典頁碼.字位單獨排列。

碼位分配


    總體採用 8140-FEFE 的矩形區域,剔除 xx7F 一條線,共 23940 個碼位。

漢字區:21008 個碼位。GB2312-80漢字區 B0A1-F7FE,6768個碼位, 6763個漢字;GB13000.1擴
    充漢字區 8140-A0FE的矩形區,剔除 xx7F, 6080 個碼位;AA40-FEA0,剔除 xx7F, 8160 個碼
    位,其中, 21 個 CJK 兼容漢字編碼在 FD9C-FE4F; 80 個增補漢字/部首/構件在 FE50-FEA0。
圖形符號區:1038 個碼位。GB2312-80非漢字區 A1A1-A9FE,846 個碼位,除了原有的標準字符
    外,其中還有: 10 個小寫羅馬數字《補充在 A2A1-A2AA, 30 個帶音調拼音字母及 安排在  
    A8A1-A8C0, 19 個豎排符號安排在 A6E0-A6F5 之間。GB13000.1 擴充非漢字區A840-A9A0,剔除 
    xx7F,192 個碼位,BIG5 非漢字字符、結構符和“O”排列在此區域。
用戶自定義區: 1894個碼位,AAA1-AFFE的矩形區, 564 個碼位;F8A1-FEFE的矩形區, 658 個
    碼位,A140-A7A0 的矩形區, 672 個碼位 (剔除 xx7F)。

GBK 與 GB 13000.1 的對應關係
•漢字區和圖形符號區的所有字符,都與 GB 13000.1 已經編碼的字符一一對應。
•52 個追加漢字、28 個部首/構件以及 13 個結構符均暫時對應於 GB 13000.1 的專用區( Private Use
    Area, E000-F8FE),如果今後這些字符正式收入了 ISO 10646/ GB 13000,本規格將作相應修改。
•帶音調的拼音字母,與 GB 13000.1 中 A_Zone 的 Latin 編碼字符相對應;與 GB 13000.1 不能對應的
    兩個字母,有待向 SC2/WG2 申請碼位。

GBK 的字形
•GBK 字形要與 ISO 10646.1/GB 13000.1 保持一致。
•在 CJK 漢字認同規則的總框架內,選用“無重碼正形”後的(GB 化)的漢字字形。

[回上一頁]



[華通資訊網] [華通科技] 版權所有
Copyrignt © 1999 All Rights Reserved
最佳螢幕顯示:800x600,請使用IE4.0瀏覽器瀏覽,E-Mail:cccltd@cccl.com.hk
自由倉頡輸入法 | 自由速成輸入法 | 華通之家 IT新聞眼 | Java魔術師