我學中文輸入法(二):嘸蝦米

 我先從輸入法的理論、系統、設計着手,學習多種正體中文使用者間常見的輸入法。結果,我最快放棄嘸蝦米。主要原因是:它的字根設計得太亂、太無理。請留意,我不是嫌它341個基本字根、156個簡速字根1)太多。嘸蝦米是大根輸入法,字根多是難免的,但它把字根歸類得很沒有系統,這才是致命傷。

 蝦米族當然會不同意這觀點。他們會說,字根雖多,但歸類得很易記,只不過是取形、音、義相關而已。可是,哪些字根取形,哪些取音,哪些取義?官方說「只要唸得出聲音來,大部份都取其音」,卻有大量例外,例如取形的「力、工、言、口、亞、田」和取義的「人、車、中、央、屯、曲」等,都明顯唸得出來。蝦米族說只要「多看多練」就可。不過,有哪種輸入法不是這樣的?對我這種講究道理的人來說,這不是答案。能看出規律、練出法門嗎?還是要走馬看花般看,囫圇吞棗地練,學得迷糊含混?尤其是嘸蝦米所謂取義的字根,又包含了像「曲、㣺、巴、虫、冘、旡」等並不是取義的2);所謂取音的字根,也包含了像「亡、辛、牛、云、且、聿」等不是取音的;所謂取形(與英文字母象形)的字根,也包含了像「(D)、扌(J)、彡(M)、マ(T)、亞(O)、辶(W)、(H)」等難以聯想的。

 再說,取音是取聲母、韻母、英文字母諧音,還是哪種?「不、方、立、皮、竹」取聲母,「也」取韻母,「耳、爾、寅」取韻尾,「西、夕、雨、魚、于」取英文字母諧音,「月、又」取聲母和介音的英文字母諧音,「尹3)、永」取去掉韻尾的英文字母諧音,「酉、與、髟」等聲稱取音卻不知取甚麼音,怎唸都不像4)!「小、少、身、生、世」取聲母歸「S」,但「食、氏、升」卻歸「X」;「方、丰、飛」歸「F」,但「弗」歸「V」;「瓜、甘」歸「G」,但「弓、冎」歸「Q」。更離譜的是,「卜」取聲母卻歸「P」而非「B」;「臼」歸「G」而非「J(北語)」或「K(粵語)」;「戶」歸「F」而非「H(北語)」或「W(粵語)」(但「乎」則正常地依北語歸「H」);「黽」讀「敏」,卻取「繩」音歸「X」;「虍」唸「呼」,卻依「據」音歸「Z」(但「據」的漢拼爲「jù」。此外,「Z」、「J」的取音輔根也歸得一片凌亂。);「糸」一般讀「覓」,卻似乎被當作「絲」音歸「S」。這次第,怎一個「亂」字了得!

 況且它取音的字根,也以北語(包括大陸普通話、臺灣華語)爲主。如「午、瓦、文、巫」歸「W」,但前兩者粵語讀「ng」聲母,後二字粵語唸「m」聲母。還有一些字根,因爲與北語的註音符號同形,就按註音符號而歸鍵。這些歸鍵,都不易讓香港人(或其他非操北語的漢語使用者)習慣,增加了非臺灣使用者的學習難度。一個拆字輸入法,本應單純以字形出發,不論其音,跨越各種漢語語言發音相異之屏障的。但嘸蝦米在設計字根系統時,就已高高築起這種屏障。

 但我還未說到戲肉。嘸蝦米歸形的字根中,竟有一部份是依靠簡化漢字作聯繫的!留意,我並不是反對形碼輸入法兼及簡體字拆碼,讓簡體使用者以同一套字根、規則去打出簡化漢字。能夠輸入所需的字,不致於有字無碼,始終是件好事。但我要指出的是,嘸蝦米有些輔根的歸形,以正簡轉換作聯繫。使用者要先懂得那字根的正、簡兩種寫法,才能把該輔根聯繫起來。你得先懂得「婁」簡體寫作「娄」,才知道「婁省掉女」這輔根歸入「米」根;你得知道「堅」簡體寫作「坚」,才知道「臣」這輔根歸入「〢」根。請問我可以只學輸入法,而不必學簡化漢字嗎?可以嗎?可以嗎?!更莫說「臣」變「〢」並不符合簡化漢字的推類規則。

 順帶一提,嘸蝦米的官方字根表中,其實漏掉了好些形狀相似的形塊,即是有若干實際應用上會碰到的字根沒有列出來。這不是嘸蝦米獨有的問題,不少輸入法的字根列表,也會這樣省掉一些形狀相似的形塊,例如只列「食」而省掉「飠(食偏旁)」,只列「金」而省掉「釒」等。要是省略得合理,一般人靠列出的根都能關聯到省去的根,也不疑事。但嘸蝦米只列出「夂」而省掉「攵」,只列出「佳」而省掉「隹」,未免太超過了吧?這些形塊雖然外貌相似,但絕大多數人都知道是不同的字或部件。不一併列出來,難免會令人困惑。又像只列出「歹」而省掉「」,使用者要拆「互」字時就難免抓破頭顱。更弊的是,一向強調容錯碼很多的嘸蝦米,偏偏不替「互」字設任何容錯碼。只列出「」而省掉「」,也使「留」的拆碼變得難記。

 嘸蝦米還有一堆簡速字根,可是簡速字根又如何歸類?繼續取形、音、義?「俞」可能取形,「並」可能取音,但有很多也不知何解,官方亦隻字不提,沒有人解釋到是依甚麼系統。蝦米族說,簡速字根可以不記,用本來的字根也可以輸入漢字,不記得就不用簡速字根。但蝦米族也說簡速字根是提升速度和減低重碼的關鍵。迴避它們,始終不是我要聽到的答案。

 輸入法規則設計上,嘸蝦米的「補短」規則也很挫敗人。一個字的末根既已取了,還要再把它「反芻」,再拆開它的尾部,取出眞末根。這種「反芻拆出眞末根」的做法,唯一好處是減低重碼率。同一鍵背負太多字根,重碼率自然高。例如說,把「少、身、生、世」都歸在「S」鍵,那麼「鈔、銵、鉎、鉪」就會重碼。但因爲要反芻再取眞末根,「鈔」的眞實取碼就是「金少㇒(ASP)」,「銵」的眞實取碼就是「金身𠂇5)(ASX)」,「鉎」的眞實取碼就是「金生一(ASE)」,「鉪」的眞實取碼就是「金世㇗6)(ASL)」,它們就不重碼了。然而,要是輸入法設計者在定義字根時,就已經把這些形狀裁小,分拆成兩個字根,也能達致相同效果。那麼爲何要定義這片大形塊作字根,不把它拆開,變成兩塊較細小的字根?

 有時同一個部件或形塊,要補甚麼末根,也是隨機的!例如「八」字作右偏旁的字。當中「扒」字在甚麼模式都能補「㇏(N)」或「丶(A)」。「叭」字在正體中文模式只能補「㇏(N)」,在簡體模式卻可補「㇏(N)」或「丶(A)」。「汃」、「釟」、「朳」中則只能補「㇏(N)」。如果說「扒」字補「丶(A)」是容錯,爲甚麼「叭」字只在簡體模式才需要容錯?而另一些「八」偏旁的字就不用容錯嗎?

 「反芻拆出眞末根」的設計是很不必要的。這做法令使用者在拆字過程上,並不是一直線順着去。拆字思路流程會變得不順暢。有時眞末根甚至不是原末根的一部份,而是全部,就更令人無言。比如「卒」字取「十十(JJJ)」,原末根「十」反芻,再取眞末根「十」,結果「十」這部件就被取了兩次。「口」和「囗」二字都取「口口(OO)」,整個字都反芻取兩次碼。「回」字取「口口口(OOO)」,第一個「口」是外框,第二個「口」是裏面的原末根,它反芻再取出眞末根「口」,內裏的「口」部件又取了兩次,還跟「品」重碼。(「品」字本身已取了三碼或已上,不用補末根,因此不是「口口口口(OOOO)」。)

 再說,嘸蝦米即使用這方法,重碼率仍然相當高7),它的使用者可以勝出輸入速度比賽,靠的是簡速編碼。除了上方提及的簡速字根,還有個別漢字的簡速碼,例如一碼字、兩碼字、兩碼字借作字根(但有些兩碼字則不能)、加V鍵快速字等。就如上述的「回」與「品」重碼,「回」可以用「OOV」或「OOOV」出字,「品」可以用「OV」出字。這輸入法靠這些正常規則以外的特殊編碼,去簡化按鍵數目,提升速度和支援盲打。

 但這種簡速碼,根本就是開外掛。要記這些簡速編碼,基本上都要逐字去記,每個字有個別的、不同的簡速編碼,很難說得上有甚麼系統、甚麼解釋。就像我唸高中時的那個化學科老師,不仔細說清化學原理的系統、解釋,只管一味說甚麼地方公開試必出,這裏那裏多少條化學公式要死背,甚麼關鍵字不可缺少或串錯,不能用同義詞代替,原因是:「你猜改卷的評分員,會有時間逐字去嗅你的萬言論文麼?哪管你寫得狗屁不通,意思相反了,只要看到有這些關鍵字,一個都不少、不算錯,就給你滿分。」有些同學很受落這套類近補習社式的敎法,但我因此而完全讀不進腦。若要靠死背去開外掛,爲何不把這些時間花在理解正式原理、規則之上?反正都是要花時間去記、去熟習,要是去記一些表面上略爲複雜的規則,我可以一理通,百理明。要是去記這些因字而異的簡速編碼,囫圇吞棗地爲拿分、爲高速而死背死記,不求甚解,我受不了。

 官方開外掛,靠外掛才可以贏,其實在一定程度上,也反映本身的拆字系統設計並不夠理想。而且,其他輸入法也可以用同類方法開外掛。倉頡輸入法開了外掛,進化成快倉或大新倉頡,也有同樣效果,速度上更勝嘸蝦米。要單純追求速度的話,學嘸蝦米不如用大新倉頡或快倉。至於一般使用者,根本就不應額外去記去背一大堆簡速碼,應該用正規的拆碼規則,取得不錯的、足夠日常應用有餘的速度,這已很好。

 誠然,蝦米族的擁躉也有不少,這種輸入法雖然不適合我,卻適合不少人。百貨應百客,我絕對尊重蝦米族對嘸蝦米輸入法的喜愛。不過看到嘸蝦米官方不時熱衷於踩倉抬嘸,有些蝦米族也中了這毒,例如把自己爭取到學校中文打字課程棄倉投嘸,視爲人生的功績8),我想我也有必要表達另一邊的感受和觀點。要記數量龐大卻雜亂無章的字根與編碼組合——341個基本字根、156個簡速字根,472個兩碼字9),還有加V鍵快速字、兩碼字能借作字根的部份,諸如此類,不勝枚擧。甚至有些字,擁躉還建議靠簡體拆碼來打才會有效率10),要我在輸入正體字時想着簡體形狀。不論蝦米族如何緊跟官方說法,四處拿着大聲公高喊「一點也不難」,對好些人來說就是難,就是亂,就是沒條理,就是不適合。所謂的「多看多練」、「看個幾次就會了,不用背啦」,只不過是任何輸入法皆可高擧的宣傳口號。蝦米族說兩三個月內(甚至說一個月內、數週內、一週內)一定學會,但是有使用者就是學不會。栽在嘸蝦米凌亂的設計和字根中,以及官方外掛裏的學習者,是大有人在的。

2016/01/28 04:20 +0800

1)
我依官網基本字根表官網簡速字根表數的。執筆時,維基百科「字根」條目說「嘸蝦米輸入法的基本字根總共有290個」,「有79個簡速字根」,皆欺詐也。2018年晚夏再査,其說已修正。我數的時候,已沒有補上「隹」、「攵」這類被官方省掉卻會應用到的形似字根,因此實際字根數量會更多。
2)
爲了節省篇幅,我已不在正文裏質疑屬於取義但取得怪的字根了。好像「佳」取「very good」歸入「V」鍵,但明明「佳」只是「good」;「斤」取「kilo」歸入「K」鍵,但明明「kilo」只是「千」。至於「日」爲何是「day」不是較直接的「sun」,「木」爲何是「tree」不是較直接的「wood」,反正不是說不通,我就由它了……
3)
可是在北語裏,「尹」與「寅」是同聲同韻的,都唸yin。結果「寅」只取韻尾歸「N」,「尹」卻去掉韻尾,歸英文字母諧音「E」。氣煞人也!
4)
在北語裏,「酉」與「又」同聲同韻,都唸you,「又」歸「U」,「酉」卻歸風馬牛不相及的「E」;「與」跟「雨、魚、于」同聲同韻,都讀yu,「雨、魚、于」歸「U」,「與」卻莫名其妙地歸「E」。還有,「髟」讀biāo,清清楚楚是重脣聲母,一點兒也不輕脣,卻歸了「V」,簡直是亂來!且莫說輕脣也應歸「F」而非「V」。
5)
這眞末根是「斜交」。
6)
官方只列「乚」而省掉「㇗」。
7)
嘸蝦米官方網站說這輸入法「選字率低」,但輸入法研究者泰瑞分析過,嘸蝦米重碼率是數種常見形碼輸入法之冠,在一萬三千多個Big5碼漢字中,竟有五成以上、近七千個漢字重碼!
9)
蝦米族樂園所說,已扣除標準字根中的兩碼字、簡速字根中的兩碼字、佔兩位置的兩碼字、標點符號的兩碼字。這數字準確否?抱歉,我已沒有精力去細數求證了……

討論區

小指, 2018/04/21 14:39 +0800

É→請問是怎麼打不出來呢??

輸入您的意見. 允許使用維基語法:
 
輸入/我學中文輸入法_二.txt · 上一次變更: 2018/08/27 16:42 +0800 由 ichirouuchiki
回到頁頂
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0