差異處
這裏顯示兩個版本的差異處。
兩邊的前次修訂版 前次修改 下次修改 | 前次修改 | ||
說文:unicode摧殘正體字 [2013/12/01 17:50 +0800] – ichirouuchiki | 說文:unicode摧殘正體字 [2020/04/20 09:17 +0800] (目前版本) – ichirouuchiki | ||
---|---|---|---|
行 2: | 行 2: | ||
====== Unicode摧殘正體字 ====== | ====== Unicode摧殘正體字 ====== | ||
- | 不學無術的「果迷」,給「黑體-繁」(又稱「Heiti TC」)所扣的帽子,最主要是指稱它「寫錯字」。正如在下連日來的論證,已說明他們口中所謂的「錯字」,是如假包換的正字,是符合字理的寫法,是符合《康熙》、《說文》等傳統權威字典的字形。眞正寫錯字的人,是他們自己。 | + | 不學無術的「果迷」,給「黑體-繁」(又稱「Heiti TC」)所扣的帽子,最主要是指稱它「寫錯字」。正如在下連日來的論證,已說明他們口中所謂的「錯字」,是如假包換的正字,是符合字理的寫法,是符合《康熙》、《說文》等傳統權威字典的字形。要是嚴格地遵從字理而論,眞正寫錯字的人,是他們自己。 |
他們另一項給「黑體-繁」扣的帽子,就是指它部件寫法不統一。例如《[[http:// | 他們另一項給「黑體-繁」扣的帽子,就是指它部件寫法不統一。例如《[[http:// | ||
行 10: | 行 10: | ||
理論上,Unicode只是編碼標準,不是字形標準。因此其官方說法是:它只對字(Character)編碼,而非字形(Glyph,每個字的具體形狀、寫法)。陸、港、臺、韓的「港」字右下從「巳」,日本的「港」字右下從「己」;港、臺、韓、日的「角」字中豎不穿頭,大陸的「角」字中豎穿頭;港、臺「起」字從「巳」,陸、日、韓從「己」……這些異形同字,Unicode都不分別編碼。例如「港」就是「6E2F」,不論從「巳」還是從「己」。 | 理論上,Unicode只是編碼標準,不是字形標準。因此其官方說法是:它只對字(Character)編碼,而非字形(Glyph,每個字的具體形狀、寫法)。陸、港、臺、韓的「港」字右下從「巳」,日本的「港」字右下從「己」;港、臺、韓、日的「角」字中豎不穿頭,大陸的「角」字中豎穿頭;港、臺「起」字從「巳」,陸、日、韓從「己」……這些異形同字,Unicode都不分別編碼。例如「港」就是「6E2F」,不論從「巳」還是從「己」。 | ||
- | 然而,爲了相容不同地區的編碼,Unicode又有「字源分離原則」。好像日本JIS編碼同時收錄了「剣」、「劍」二形,Unicode爲了與之兼異,即使它們是同一個字,Unicode也分別給予編碼:「剣」是「5263」,「劍」是「528D」。 | + | 然而,爲了相容不同地區的編碼,Unicode又有「原規格分離原則」(又譯「字源分離原則」,但並不是指漢字文字學的「字源」,而是指「來源字集」。爲免混淆,一郎並不採用此翻譯)。好像日本JIS編碼同時收錄了「剣」、「劍」二形,Unicode爲了與之兼容,即使它們是同一個字,Unicode也分別給予編碼:「剣」是「5263」,「劍」是「528D」。 |
<WRAP right 400px>< | <WRAP right 400px>< | ||
- | <WRAP centeralign> | + | <WRAP centeralign> |
- | <fc # | + | <color # |
- | <fc # | + | <color # |
至於「精」、「靖」、「晴」三字,從「月」的字形,分別有「7CBE」、「9756」、「6674」這三個常規編碼;從「円」的字形,則獲編作「FA1D」、「FA1C」、「FA12」。問題是,從「円」的那些「FAXX」編碼,並非常規編碼,而是「兼容區」編碼。於是,在Windows 7或8裏開啟「倉頡輸入法」,無論怎麼拆碼,都輸入不到從「円」的「精」、「靖」、「晴」三字。碼不是沒有編,但根本不想你用。 | 至於「精」、「靖」、「晴」三字,從「月」的字形,分別有「7CBE」、「9756」、「6674」這三個常規編碼;從「円」的字形,則獲編作「FA1D」、「FA1C」、「FA12」。問題是,從「円」的那些「FAXX」編碼,並非常規編碼,而是「兼容區」編碼。於是,在Windows 7或8裏開啟「倉頡輸入法」,無論怎麼拆碼,都輸入不到從「円」的「精」、「靖」、「晴」三字。碼不是沒有編,但根本不想你用。 | ||
行 25: | 行 25: | ||
既然Unicode對這些異體字的處理如此混亂,字型設計者若依從它,只會使字型也變得混亂。若說要統一這些部件的寫法,我同意。但統一的方向,應當是依照《康熙》、《說文》等正統印版字形,而非大陸或臺灣那套以手寫楷字竄改印版字形的所謂「標準」。換言之,只獲編一碼的「請」、「情」等字,當寫作從「円」部件;分別被賦予兩個碼的字,不管哪個碼位,不論是「9751」還是「9752」,是「6DF8」還是「6E05」,都同樣應寫作「円」部件。如是者,整套字型裏的字形才統一。不論輸入法、軟件對編碼的支援、字型涵蓋的編碼範圍如何,使用者都能顯示出正確的傳統字形。 | 既然Unicode對這些異體字的處理如此混亂,字型設計者若依從它,只會使字型也變得混亂。若說要統一這些部件的寫法,我同意。但統一的方向,應當是依照《康熙》、《說文》等正統印版字形,而非大陸或臺灣那套以手寫楷字竄改印版字形的所謂「標準」。換言之,只獲編一碼的「請」、「情」等字,當寫作從「円」部件;分別被賦予兩個碼的字,不管哪個碼位,不論是「9751」還是「9752」,是「6DF8」還是「6E05」,都同樣應寫作「円」部件。如是者,整套字型裏的字形才統一。不論輸入法、軟件對編碼的支援、字型涵蓋的編碼範圍如何,使用者都能顯示出正確的傳統字形。 | ||
- | 然而,這種主張也有人反對。在下強烈推薦的傑兄文章〈[[http:// | + | 然而,這種主張也有人反對。在下強烈推薦的傑兄文章〈[[http:// |
對此,我看到But兄的回應有一大盲點:「『柿、杮』之別」與「『為、爲』之別」是兩個截然不同的概念,他卻弄混了。論證有訛謬,結論亦因此有誤。 | 對此,我看到But兄的回應有一大盲點:「『柿、杮』之別」與「『為、爲』之別」是兩個截然不同的概念,他卻弄混了。論證有訛謬,結論亦因此有誤。 |