作者: hi.friend

Big5內碼表(Big5 character code table)

BIG-5 (大五碼) is double-byte character set (DBCS) with:

byte 1: 0x81 to 0xFE
byte 2: 0x40 to 0x7E and 0xA1 to 0xFE

Organization:

0x8140 to 0xA0FE: 造字區
0xA140 to 0xA3BF: 標點符號、希臘字母及特殊符號
0xA3C0 to 0xA3E0: 33控制字元圖像 (倚天 extension)
0xA3E1 to 0xA3FE: 造字區
0xA440 to 0xC67E: 常用字
0xC6A1 to 0xC875: 罕用符號、康熙字典部首、日文字母、西里爾字母 (倚天extension)
0xC876 to 0xC8FE: 造字區
0xC940 to 0xF9D5: 次常用字
0xF9D6 to 0xF9FE: 「碁、銹、裏、墻、恒、粧、嫺」七字及製表符號 (倚天extension)
0xFA00 to 0xFEFE: 造字區

BIG-5碼﹕

1984年，工業資訊策進會（簡稱:資策會）印發了一本「電腦用中文字型與字碼對照表」俗稱「BIG-5碼」。BIG-5碼的制定係由資策會策畫，原先是為配合五大套裝軟體而制訂，故稱為BIG-5碼，雖然五大套裝軟體宣告失敗，但目前市面上仍有多數的套裝軟體是在BIG-5內碼系統下所發展出來的。 BIG-5碼系統為兩位元組的內碼系統，共蒐集13,053個中文字，字序依先筆畫數後部首的方式排列。 (閱讀全文…)

13 10 月, 2019
倉頡三代、五代差異字碼表

朱邦復先生在發明倉頡輸入法時，就規劃出「字序」丶「字碼」丶「字形」丶「字音」丶「字辨」丶「字義」這六大聯想問題。而字序丶字碼丶字形在朱邦復先生發展的中文系統下，向來是三合一不可分的。也就是說，字碼內含有倉頡碼的訊息，『有字必有碼，有碼就有字』。所以有倉頡碼，也就有中文內碼，其字序與拆碼者目視同；而倉頡碼（或說字碼）也能直接送入中文系統，取得字形。

1987年，朱邦復先生由國外回到中國，在深圳科技園率領工作團隊，開發了全漢大字庫及聚珍中文系統。之後，配合聚珍整合系統，開始推廣第五代倉頡輸入法。他希望倉頡使用者及軟體製造者都能移轉到第五代倉頡，並統一下來。

倉三與倉五的差別，在於 13,060 個 Big5 碼的漢字（包括 7 個倚天造字區的漢字）範圍裡，當中有 12,773 個字（超過 97.8% 的比例）的第三代及第五代的組字，字根是相同的，所以兩代的差異只影響幾百個中文字而已。

朱先生祈望使用舊版本的學者都轉用倉頡五代。其實，移轉的過程並不困難，對已經學會第三代的倉頡族來說，學習第五代倉頡時並不會花太多時間，因為第五代只是將第三代作小幅度的修改，只要花小小的精神和時間，就能順利學會第五代倉頡了！ (閱讀全文…)

25 9 月, 2019
省略原則 – 倉頡

倉頡拆碼基本原則，「字首」部份最多取 2 碼，「字身」部份最多取 3 碼，「分體字」最多取 5 碼，「連體字」最多取 4 碼。若一個字形碼數超過上述之限制時，就需要根據此原則省略其中幾碼。

省略原則分為「部分省略」（或稱「局部省略」）及「包含省略」兩種，意指「尾碼」的取法，須要先視乎該尾碼是否被其他字形「三面包圍」或者「四面封閉」，若有這種情況，就要省略原有的尾碼字形，而取在外面包圍的字形碼。

部份省略－無論字首或字身，從「頭頭尾」和「頭尾尾」的取碼口訣可見，除了這三個碼外，字體其餘部份的字碼一概省略。
例︰”蟬 LI-RRJ（中戈.口口十）”字的字首 “虫”字取碼為 LMI（中一戈），但只取首尾碼 LI（中戈），而字首中間之碼 M（一）則省略，此為『部份省略』﹔其字身”單”字取碼為 RRWJ（口口田十），只取首次尾碼 RRJ（口口十），而中間之碼 W（田）則省略。

包含省略－無論字首或字身，若其尾碼被其他字碼三面或四面包圍者，則取其外圍字碼為尾碼，並省略圍內之字碼，但若碼數不足時，包含省略無效。

註：當看見以上三面或四面的「外框」字碼之外形，這就是「包含省略」原則。 (閱讀全文…)

24 9 月, 2019
難字 – 倉頡

倉頡把部份中文字定為難字，並不是因為這些字很難寫，甚至有些難字是很簡單的字。為何會被歸類為難字，而是這些字的筆劃繁瑣，形狀過於瑣碎，導致不易取碼，難以找到合適的倉頡字母或輔助字型。爲了方便拆碼，特別規定了一些難字，以「難（Ｘ）」碼，去代替難取部份，唯此類字形不多。

在此給出 18 個難字，再加上平時很小會用到的 7 個罕用難字，共 25 個難字部。 (閱讀全文…)

23 9 月, 2019
複合字首(特別字首)&複合字 – 倉頡

倉頡輸入法由於有部份用作部首的中文字，我們會以兩個字碼取代分柝出來。為了方便拆碼，分成「複合字首」及「複合字」二種，而取碼方法較為特別，學者務必緊記。

「複合字首」又稱（特別字首）做字首或次字首時，視爲一整體，只取頭、尾兩碼。在三代共有 14 個，第五代新增 2 個，共 16 個複合字首。

「複合字」一律視爲一整體，只取頭、尾兩碼。在三代共有 8 個，第五代新增 2 個，共 10 個複合字。 (閱讀全文…)

22 9 月, 2019
特殊字(例外字) – 倉頡

倉頡輸入法規則，是不容許字碼重疊的，但是，當有其他筆劃重疊在（木、大、火、戈、七）時，必須先取（木、大、火、戈、七）再取其他字碼。

其用意：

1. 取碼盡量少，以符合精簡原則。

2. 不分割字形，保持字形完整特徵，避免字形支離破碎。

特殊字的注意事項：

一、重疊在特殊字上的字形可以計入中豎，且計入中豎的取碼方式通常更符合字形特徵原則而優先採用。例如「東」字視爲「田」重疊在「木」上，而非「日」或「曰」重疊在「木」上。

二、特殊字只在內部允許重疊。例如若「央」取碼作「大月」（），則並非使用特殊字，而是試圖跨越取碼（但實際上此字不符合跨越取碼的條件，而取碼作「中月大」），因為「」不是在「」的內部。

三、特殊字無絕對優先權，具體取碼仍須考量字形特徵、精簡、先繁後簡等其他原則。例如「未」取碼作「十木」而非「木十」（使用特殊字），而「末」取碼作「木十」（使用特殊字）而非「十木」，因如此取碼更能彰顯字形特徵。其他例子如「春」取碼作「手大日」而非「大手日」（使用特殊字）、「実」取碼作「十手大」而非「十大手」（使用特殊字）；「㦮」取碼作「戈手」（使用特殊字）而非「戈手十心」；「夫」取碼作「手人」而非「大十」（使用特殊字）。 (閱讀全文…)

21 9 月, 2019