作者: hi.friend

  • Big5內碼表(Big5 character code table)

    BIG-5 (大五碼) is double-byte character set (DBCS) with:

    byte 1: 0x81 to 0xFE
    byte 2: 0x40 to 0x7E and 0xA1 to 0xFE

    Organization:

    0x8140 to 0xA0FE: 造字區
    0xA140 to 0xA3BF: 標點符號、希臘字母及特殊符號
    0xA3C0 to 0xA3E0: 33控制字元圖像 (倚天 extension)
    0xA3E1 to 0xA3FE: 造字區
    0xA440 to 0xC67E: 常用字
    0xC6A1 to 0xC875: 罕用符號、康熙字典部首、日文字母、西里爾字母 (倚天extension)
    0xC876 to 0xC8FE: 造字區
    0xC940 to 0xF9D5: 次常用字
    0xF9D6 to 0xF9FE: 「碁、銹、裏、墻、恒、粧、嫺」七字及製表符號 (倚天extension)
    0xFA00 to 0xFEFE: 造字區

    BIG-5碼﹕

    1984年,工業資訊策進會(簡稱:資策會)印發了一本「電腦用中文字型與字碼對照表」俗稱「BIG-5碼」。BIG-5碼的制定係由資策會策畫,原先是為配合五大套裝軟體而制訂,故稱為BIG-5碼,雖然五大套裝軟體宣告失敗,但目前市面上仍有多數的套裝軟體是在BIG-5內碼系統下所發展出來的。 BIG-5碼系統為兩位元組的內碼系統,共蒐集13,053個中文字,字序依先筆畫數後部首的方式排列。 (閱讀全文…)

  • 倉頡三代、五代差異字碼表

    朱邦復先生在發明倉頡輸入法時,就規劃出「字序」丶「字碼」丶「字形」丶「字音」丶「字辨」丶「字義」這六大聯想問題。而字序丶字碼丶字形在朱邦復先生發展的中文系統下,向來是三合一不可分的。也就是說,字碼內含有倉頡碼的訊息,『有字必有碼,有碼就有字』。所以有倉頡碼,也就有中文內碼,其字序與拆碼者目視同;而倉頡碼(或說字碼)也能直接送入中文系統,取得字形。

    1987年,朱邦復先生由國外回到中國,在深圳科技園率領工作團隊,開發了全漢大字庫及聚珍中文系統。之後,配合聚珍整合系統,開始推廣第五代倉頡輸入法。他希望倉頡使用者及軟體製造者都能移轉到第五代倉頡,並統一下來。

    倉三與倉五的差別,在於 13,060 個 Big5 碼的漢字(包括 7 個倚天造字區的漢字)範圍裡, 當中有 12,773 個字(超過 97.8% 的比例)的第三代及第五代的組字,字根是相同的,所以兩代的差異只影響幾百個中文字而已。

    朱先生祈望使用舊版本的學者都轉用倉頡五代。其實,移轉的過程並不困難,對已經學會第三代的倉頡族來說,學習第五代倉頡時並不會花太多時間,因為第五代只是將第三代作小幅度的修改,只要花小小的精神和時間,就能順利學會第五代倉頡了! (閱讀全文…)

  • 省略原則 – 倉頡

    倉頡拆碼基本原則,「字首」部份最多取 2 碼,「字身」部份最多取 3 碼,「分體字」最多取 5 碼,「連體字」最多取 4 碼。若一個字形碼數超過上述之限制時,就需要根據此原則省略其中幾碼。

    省略原則分為「部分省略」(或稱「局部省略」)及「包含省略」兩種,意指「尾碼」的取法,須要先視乎該尾碼是否被其他字形「三面包圍」或者「四面封閉」,若有這種情況,就要省略原有的尾碼字形,而取在外面包圍的字形碼。

    部份省略-無論字首或字身,從「頭頭尾」和「頭尾尾」的取碼口訣可見,除了這三個碼外,字體其餘部份的字碼一概省略。
    例︰”蟬 LI-RRJ(中戈.口口十)”字的字首 “虫”字取碼為 LMI(中一戈),但只取首尾碼 LI(中戈),而字首中間之碼 M(一)則省略,此為『部份省略』﹔其字身”單”字取碼為 RRWJ(口口田十),只取首次尾碼 RRJ(口口十),而中間之碼 W(田)則省略。

    包含省略-無論字首或字身,若其尾碼被其他字碼三面或四面包圍者,則取其外圍字碼為尾碼,並省略圍內之字碼,但若碼數不足時,包含省略無效。

    註:當看見以上三面或四面的「外框」字碼之外形,這就是「包含省略」原則。 (閱讀全文…)

  • 難字 – 倉頡

    倉頡把部份中文字定為難字,並不是因為這些字很難寫,甚至有些難字是很簡單的字。為何會被歸類為難字,而是這些字的筆劃繁瑣,形狀過於瑣碎,導致不易取碼,難以找到合適的倉頡字母或輔助字型。爲了方便拆碼,特別規定了一些難字,以「難(X)」碼,去代替難取部份,唯此類字形不多。

    在此給出 18 個難字,再加上平時很小會用到的 7 個罕用難字,共 25 個難字部。 (閱讀全文…)

  • 複合字首(特別字首)&複合字 – 倉頡

    倉頡輸入法由於有部份用作部首的中文字,我們會以兩個字碼取代分柝出來。為了方便拆碼,分成「複合字首」及「複合字」二種,而取碼方法較為特別,學者務必緊記。

    「複合字首」又稱(特別字首)做字首或次字首時,視爲一整體,只取頭、尾兩碼。在三代共有 14 個,第五代新增 2 個,共 16 個複合字首。

    「複合字」一律視爲一整體,只取頭、尾兩碼。在三代共有 8 個,第五代新增 2 個,共 10 個複合字。 (閱讀全文…)

  • 特殊字(例外字) – 倉頡

    倉頡輸入法規則,是不容許字碼重疊的,但是,當有其他筆劃重疊在(木、大、火、戈、七)時,必須先取(木、大、火、戈、七)再取其他字碼。

    其用意:

    1. 取碼盡量少,以符合精簡原則。

    2. 不分割字形,保持字形完整特徵,避免字形支離破碎。

    特殊字的注意事項:

    一、重疊在特殊字上的字形可以計入中豎,且計入中豎的取碼方式通常更符合字形特徵原則而優先採用。例如「東」字視爲「田」重疊在「木」上,而非「日」或「曰」重疊在「木」上。

    二、特殊字只在內部允許重疊。例如若「央」取碼作「大月」(),則並非使用特殊字,而是試圖跨越取碼(但實際上此字不符合跨越取碼的條件,而取碼作「中月大」),因為「」不是在「」的內部。

    三、特殊字無絕對優先權,具體取碼仍須考量字形特徵、精簡、先繁後簡等其他原則。例如「未」取碼作「十木」而非「木十」(使用特殊字),而「末」取碼作「木十」(使用特殊字)而非「十木」,因如此取碼更能彰顯字形特徵。其他例子如「春」取碼作「手大日」而非「大手日」(使用特殊字)、「実」取碼作「十手大」而非「十大手」(使用特殊字);「㦮」取碼作「戈手」(使用特殊字)而非「戈手十心」;「夫」取碼作「手人」而非「大十」(使用特殊字)。 (閱讀全文…)