狗肉字根我不受

 中共治下的大陸,曾有一輸入法,名曰「認知碼」,是甚麼「國家『八五』重點科技攻關項目926工程」的成果之一。嘩,好不巴閉,小鳳姐云:「齊鼓掌!」啪啪啪。雖然大家根本不明白一個輸入法有甚麼「重點」的科技要「攻」甚麼「關」做甚麼「工程」,甚至不知道甚麼「八五」甚麼「926」是年份月份日子項目數量還是甚麼瞎扯吹牛皮。它曾通過國家敎委的技術鑑定,曾在廣東、天津和北京一批學校裏試驗,還聲稱「效果很好」,打算在一九九五年推向全國中小學。然而,據中文維基百科記載,當時有硏究者在《計算機世界》撰文批評過它,以大量分析和數據指出它不宜推廣。後來,它像綠壩娘那般,在花了國家不知多少錢後就無疾而終,人間蒸發。

 認知碼的字根系統是怎樣的?據資料,它有四百個多字根,比大陸許多形碼輸入法都要多。硏究者撰文批評它時,就列出多數輸入法的字根數目作對比,直接指出字根越多越難記難學。不但學習者難以全部熟記,甚至連發明人也出糗。明明設了「朱」這個字根,但連發明人自己都忘記,把「朱」的編碼設定爲「ノ、未」,其他「朱」部件的字也是如此,「朱」這字根就變成沒有用的垃圾。而且這不是孤例,認知碼的許多字根,都像「朱」一樣可以再分拆作兩個或多個字根。當中有些字根使用率不高,萬一眞的碰到它,使用者就很難搞清楚到底要再拆開,還是不要再拆。例如在「鼠」、「黑」、「骨」要拆開的同時,「俞」、「愛」竟然不用再拆,這點就被撰文的硏究者擧出來批評。

 認知碼歸鍵方法,是看字根在北語中唸甚麼聲母。例如「韓」字拆做「十」、「早」、「韋」,「十」是「shi」,「早」是「zao」,「韋」是「wei」,於是要打「SZW」。如是者,明明是取形的輸入法,思維卻要同時花在發音上。有好些字根,由於並不成字,發明人還人爲地賦予它們讀音,增加學習困難。同一鍵上也有太多字根,使用者連想用鍵盤貼紙來幫助學習都不能。

 硏究者還批評,認知碼重碼率高,簡碼的使用不科學。

 現在認知碼皮已收。這絕對不是壞事,因爲它只是是個負面示範,讓人看到設計不良的輸入法會是甚麼樣子。可是,有種輸入法的字根系統,問題跟認知碼「不相伯仲」,甚至「不甘後人」,卻在其敎徒傳銷下大行其市。這種輸入法,名叫嘸蝦米。

 嘸蝦米,官方在「字根『總』表」上列出三百四十一個字根,然後又在「簡速字根總表」上多添一百五十六個,共計四百九十七個字根,比認知碼還要多近一百個。當然也難以使用鍵盤貼紙。

 嘸蝦米的字根中,不論普通字根還是簡速字根,都有許多大形塊,與認知碼相同。若屬於簡速字根,你最好不再拆開它,但也可以再拆。它與認知碼一樣,在「鼠」、「黑」、「骨」必須拆開的同時,「俞」、「愛」就不用再拆,可以整塊輸入。不過,因爲「俞」、「愛」屬簡速字根,要是再拆了,也可以的。

 至於普通字根,原則上不可以再拆,要取大根。但偶爾又會有容錯碼,錯誤地再拆了也可以輸入,卻不一定有。例如「微」字,「兩撇一座山再加一橫」竟然是一塊字根,要先取。接着取左下角的「〡」,中下方的「儿」,和最右旁的「攵」。不過若拆細了,變成「兩撇」、「〡」、「山」,再加最右旁的「攵」,也容許的。但如「髟」字,就不可以再拆,必須視爲一塊字根,而且沒有容錯,拆細了就無法輸入。

 簡速字根最好直接輸入,但也可以再拆細。普通字根原則上不可以再拆細。不過部份字設了容錯碼,誤拆了普通字根仍可輸入。使用者不但要記住哪些是字根,哪些不是,還要記住哪些字根屬於簡速者,哪些卻只是普通字根,然後才可以知道,他應不應、可不可以再拆細。這比認知碼還複雜,要記住的東西比認知碼還多、還亂。

 嘸蝦米的字根歸鍵,當中有一堆都與認知碼一樣,視乎其北語讀音。卻不一定像認知碼般按其聲母。也許按其韻母、韻腹、韻尾、整體諧音,甚至不知甚麼音來歸鍵。跟認知碼一樣,它亦包含了不成字部件的人爲造音。例如上方說過的「髟」,它在北語裏明明讀「biāo」,卻人爲地替它造了個不存在的「v」音。而北語「b」聲母的「卜」字,卻歸到「P」鍵裏。讀音相同的字,或者只有聲調不同的字,不時會歸到不同的鍵裏。有時還好像摻雜閩南語(但一郎不懂閩南語,無法肯定)。

 但同一時間,嘸蝦米又有不少能唸出來的部件,不依發音,而依跟英文字母形似,或者跟其他字根形似,或者跟英譯的首字母等關係來歸鍵。到底一個字根,甚麼時候依音,甚麼時候按形,甚麼時候取英譯,根本任發明人是但噏,沒有準繩可從。學習者即使知道某個形塊是字根,也未必能記住它到底是以形、音還是義來聯想,不同的聯想方法會互相干擾,徒添混亂。而且這些所謂的形似或英譯,又不乏甚爲牽強者。諸如說「亞」形似「O」,說「巾」形似「N」,說「辶」形似「W」,說「佳」譯作「very good」而不是「good」等等。

 嘸蝦米字根還有兩大問題。首先,正常分拆漢字時,許多人都會拆到的形塊,如「艹」、「罒」、「コ」、「攵」、「隹」等,都不在字根表裏。那即是要再拆細,例如把「艹」拆成「十十」嗎?原來不是,而是要借用表上另一個字根「廾」!「罒」要借用「皿」,「コ」要借用「ユ」,「攵」要借用「夂」,「隹」要借用「佳」!中文維基百科的「嘸蝦米輸入法」條目,說「如果沒有該字根,在拆字時要借用樣貌相似的字根」,還稱這是「潛規則」——官方沒說出來,但在分解漢字時實際上會用到。這個所謂「潛規則」的說法已近乎替官方狡辯!這完完全全是一郎在上一篇文章中所說,使用者要煲周打蜆湯,卻無法找到蜆,要硬着頭皮用蠔來權充!那麼煮出來的,還是周打「蜆」湯嗎?

 而且使用者若養成了習慣,以差不多先生的心態對待字根形狀,有時又會中伏。比如「犂」的右上角,嘸蝦米編碼是視作字根表上的「ㄉ」,把兩筆的「勹」與一筆的「ㄅ」相混。若使用者習慣了,看到「勹」時都視爲字根表上的「ㄅ」,那就踩地雷了——單是「勹」或「ㄅ」的話,是歸在不同鍵裏的!兩筆的「勹」與一筆的「ㄅ」是否要區分,連官方字根表都自相矛盾。又如表上沒有「无」這字根,使用者若眞的在字根表上找貌似的「旡」字根借用,又中伏了。這次「无」要拆細作「一、尢」。甚麼時候借用貌似字根,甚麼時候細拆,根本無所適從。有好些字根,甚至完全沒有在字根表上列出,嘸蝦米査碼程式的製作者還在blog上沾沾自喜,將之稱作「隱藏字根」,叫使用者用査碼程式找出來1)。這明明不是甚麼光彩的事!

 其次,嘸蝦米字根雖多,卻往往無法區分近形的字。例如「干」字、「千」字、「干」字豎筆變撇、「千」字豎筆變撇,四者都歸在同一鍵上。因此「干」和「千」重碼,「天」和「夭」也重碼。嘸蝦米官方還特別說,把字根設定成這樣,「刊」和異體「刋」就不用編成不同的碼,如此云云。謬矣哉!「刊」讀「看」平聲,指刊刻或書冊;「刋」唸「千」去聲,解作切。昔日執字粒時代,曾有報章誤用,以「刋」代「刊」,還遭讀者投函指正。兩字雖是近形,卻不是異體,其區分的關鍵正正在首筆。有些字有異體寫法,爲異體多設一組編碼,技術上不難,嘸蝦米本身也有不少異體碼。但要有效區分形似異字,才眞正考輸入法設計者功夫。爲了很容易解決的支援異體問題,令眞正需要分辨的關鍵差異無法區分,造成「結構性」的重碼——即是有一些常用偏旁重碼,導致含有該偏旁的一系列字都會重碼。這樣的字根系統怎可能給高分呢?

 只要肯睜開眼睛,大家都可以看到,嘸蝦米字根系統凌亂無章,自相矛盾。這點是客觀事實。差在看倌在主觀感情方面是否願意承認。早陣子在百度倉頡帖吧上,有人在網上推薦嘸蝦米給別人,就推銷它「非常易學」,聲稱自己只花了四小時去背嘸蝦米字根,說:「嘸蝦米字根是亂,但真的好背!」如此云云。誠然,有些人記憶力好,給他一堆凌亂的東西,只要說明必須記住,他就自己會找方法牢記。但不可以因他的能力高,就認爲其他人也可以記住,也可以接受如此凌亂無章的字根系統!正如一郎唸中學時,化學老師以補習社式的雞精敎法,不好好解釋化學現象背後的細緻科學原理,一味說甚麼化學公式要背,還眞的要我默書般背默;一味說甚麼關鍵字是重點,考試時必須寫出來不可串錯,但當中的過程可以亂寫:「沒有人會理會,你以爲改卷佬有閒情嗅你的解說麼?」有些同學很喜愛這種補習社式的敎法,但我在他敎導下,無法眞正了解背後的原理、操作,初時依他所說不斷死背,還勉強低空略過,後來東西多起來,就墜機了。

 除了我自己,我也從網上接觸到好些人,覺得嘸蝦米字根系統雜亂非常,甚或認爲它是「渣」。當中有已使用嘸蝦米多年的朋友。然而,如果你在搜尋引擎上找,或者瀏覽一些臺灣的輸入法討論板塊,卻甚少看到這種聲音,相反,有許多人都不斷說嘸蝦米很好學、字根很好記。說得動聽點,這叫傳銷做得好,說得難聽點,這叫三人成虎。傳銷時掛着「字根很好學」的羊頭,販賣凌亂的、貨不對辦的狗肉字根系統。誠然,有朋友記性好,或其他原因,了解過以後,自己選擇去接受、去學習這套字根系統,我絕對尊重。不過若有人罔顧事實,散播「嘸蝦米字根很好學」這種失實傳銷口號,我自問沒有容下指鹿爲馬的能力,接受不了。

 還有一種叫快碼的商業輸入法,跟嘸蝦米一樣愛以謊言吹捧自己,並攻擊其他輸入法。而它的字根系統,缺點也跟嘸蝦米相似。例如宣稱快碼字根與英文字母象形,卻不乏牽強者。例如說「同、內、用」像「M」而「月、肉、円」像「N」;說「國、田、甲、曲」像「U」而「山」像「V」;說「戈、戊、民、瓦、成」像「C」;說「可、勻、勿、司」「D」等。字根的歸鍵也混雜英譯等其他方法,例如「木」取「T」(tree)、「土」取「G」(ground),並不統一以形似來歸鍵。字根時常無法好好區分近形偏旁,導致「結構性」的重碼。比如「金」旁和「食」旁,「方」旁、「皮」旁和「反」旁,「未」旁、「朱」旁、「耒」旁和「乘」旁等,全都重碼,其字根比嘸蝦米區分能力更差得多!但字根系統着造成這麼多的重碼,基本上每組輸入碼的候選字都一大堆,快碼的發明人居然膽敢聲稱其重碼率只有約5%,即是比倉頡還低!快碼也聲稱它平均輸入2.1個鍵便可打出一個中文字,即是比速成還少!如此指鹿爲馬,掛羊頭賣狗肉,我們眞的要相信嗎?

2016/10/26 17:37 +0800

討論區

尹卂, 2016/10/29 11:12 +0800

天蒼人頡已經換了個域名

ejsoon.win

希望你發一封郵件給我,這樣在我更換域名的時候還能及時取得聯絡。

少齊, 2016/12/10 07:47 +0800

你好,我看了中文輸入法的文章,覺得你對輸入法有深入研究,以下有一個討論是關於一個免費的香港的輸入法,縱橫碼,好像很厲害似的,希望你亦可寫一篇文章詳細解構這個輸入法,謝謝你,期望的分析文章:

http://www.hkepc.com/forum/viewthread.php?tid=2340679

內木一郎, 2016/12/12 13:33 +0800

少齊你好!個人淺見,談不上甚麼深入研究,實在見笑。

要談輸入法,先要看談論目的。在下平時的文章,是以輸入法作爲漢字觀照系統來思考。然而,一般人看輸入法,可能是想幫助自己去挑選一款快速的、自己喜歡的輸入法。跟在下撰文之意未必相同。如果要選擇一款自用,每個人的習慣、喜好、考慮因素都不相同,這方面在下難以胡言指點的。

看了連結的討論,似乎閣下過往使用九方,那麼縱橫和行列都有相似處。三者都要考慮漢字或部件的筆形。然而三種輸入法間,彼此的筆形定義各異,都要時間重新適應。

縱橫只用數字鍵盤,以單手打字,這點與九方相似。以單字而言,它直接取漢字的四角筆形編碼,卻不像九方般按了一鍵後就馬上顯示一版提示或選字。它着眼點在於一整個漢字的四角筆形,不用把整個漢字分拆。它的筆形不算複雜,不算難學。然而四角相似的字未必能分辨。若配合詞組輸入的話,可減低重碼,達致快打。當然,這也取決於你要輸入的詞語是否包含在其已編碼的詞組裏,若沒有,則要重新逐字輸入。

行列則不同,是拆作一個個字根的輸入法,運用盤的字母區而非數字區,要記憶字根。只是字根歸入哪個字母鍵裏,是按字根首尾筆形,來決定其座標鍵位。所以思考上還是要把漢字拆成各片字根,輸入時還是以雙手在字母區按字母鍵。

縱橫和行列的編碼都開源,即使作業系統沒有提供,閣下也可以拿它的碼表套入到一些輸入法引擎裏。

少齊, 2016/12/13 21:40 +0800

Hello, 相當detailed的分析,已閱讀,明白了,thank you very much.!!!

下里巴人, 2017/08/19 12:44 +0800

為什麼不用注音輸入法輸入漢字呢?非常符合人的思維方式,怎麼讀的怎麼輸入……

內木一郎, 2017/09/23 16:17 +0800

一:倉頡等重碼率少的形碼輸入法可以盲打——即是不看着螢幕來打字,結果仍然可信。注音或拼音不能,即使用了詞庫,同音字詞還是太多,必須看着螢幕來選取正確的字詞。二:漢字同時用於不同語言,例如粵語、客語、湘語、北語等,甚至日語等也有許多漢字。既然我的目的是掌握如何輸入漢字,不管源語言是哪種,只要看着漢字就能輸入,那麼,我就自然不想被單一種語言綁着。

輸入您的意見. 允許使用維基語法:
 
輸入/狗肉字根我不受.txt · 上一次變更: 2016/12/12 11:44 +0800 由 ichirouuchiki
回到頁頂
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0