差異處
這裏顯示兩個版本的差異處。
兩邊的前次修訂版 前次修改 下次修改 | 前次修改 | ||
說文:unicode摧殘正體字 [2013/01/10 05:27 +0800] – ichirouuchiki | 說文:unicode摧殘正體字 [2020/04/20 09:17 +0800] (目前版本) – ichirouuchiki | ||
---|---|---|---|
行 2: | 行 2: | ||
====== Unicode摧殘正體字 ====== | ====== Unicode摧殘正體字 ====== | ||
- | 不學無術的「果迷」,給「黑體-繁」(又稱「Heiti TC」)所扣的帽子,最主要是指稱它「寫錯字」。正如在下連日來的論證,已說明他們口中所謂的「錯字」,是如假包換的正字,是符合字理的寫法,是符合《康熙》、《說文》等傳統權威字典的字形。眞正寫錯字的人,是他們自己。 | + | 不學無術的「果迷」,給「黑體-繁」(又稱「Heiti TC」)所扣的帽子,最主要是指稱它「寫錯字」。正如在下連日來的論證,已說明他們口中所謂的「錯字」,是如假包換的正字,是符合字理的寫法,是符合《康熙》、《說文》等傳統權威字典的字形。要是嚴格地遵從字理而論,眞正寫錯字的人,是他們自己。 |
他們另一項給「黑體-繁」扣的帽子,就是指它部件寫法不統一。例如《[[http:// | 他們另一項給「黑體-繁」扣的帽子,就是指它部件寫法不統一。例如《[[http:// | ||
行 8: | 行 8: | ||
若有細讀在下之前的〈[[說文: | 若有細讀在下之前的〈[[說文: | ||
- | 理論上,Unicode只是編碼標準,不是字形標準。因此其官方說法是:它只對字(Character)編碼,而非字形(Glyph,每個字的具體形狀、寫法)。陸、港、台、韓的「港」字右下從「巳」,日本的「港」字右下從「己」;港、台、韓、日的「角」字中豎不穿頭,大陸的「角」字中豎穿頭;港、台「起」字從「巳」,陸、日、韓從「己」……這些異形同字,Unicode都不分別編碼。例如「港」就是「6E2F」,不論從「巳」還是從「己」。 | + | 理論上,Unicode只是編碼標準,不是字形標準。因此其官方說法是:它只對字(Character)編碼,而非字形(Glyph,每個字的具體形狀、寫法)。陸、港、臺、韓的「港」字右下從「巳」,日本的「港」字右下從「己」;港、臺、韓、日的「角」字中豎不穿頭,大陸的「角」字中豎穿頭;港、臺「起」字從「巳」,陸、日、韓從「己」……這些異形同字,Unicode都不分別編碼。例如「港」就是「6E2F」,不論從「巳」還是從「己」。 |
- | 然而,爲了相容不同地區的編碼,Unicode又有「字源分離原則」。好像日本JIS編碼同時收錄了「剣」、「劍」二形,Unicode爲了與之兼異,即使它們是同一個字,Unicode也分別給予編碼:「剣」是「5263」,「劍」是「528D」。 | + | 然而,爲了相容不同地區的編碼,Unicode又有「原規格分離原則」(又譯「字源分離原則」,但並不是指漢字文字學的「字源」,而是指「來源字集」。爲免混淆,一郎並不採用此翻譯)。好像日本JIS編碼同時收錄了「剣」、「劍」二形,Unicode爲了與之兼容,即使它們是同一個字,Unicode也分別給予編碼:「剣」是「5263」,「劍」是「528D」。 |
- | <WRAP right 400px>< | + | <WRAP right 400px>< |
- | <WRAP centeralign> | + | <WRAP centeralign> |
- | <fc # | + | <color # |
- | <fc # | + | <color # |
至於「精」、「靖」、「晴」三字,從「月」的字形,分別有「7CBE」、「9756」、「6674」這三個常規編碼;從「円」的字形,則獲編作「FA1D」、「FA1C」、「FA12」。問題是,從「円」的那些「FAXX」編碼,並非常規編碼,而是「兼容區」編碼。於是,在Windows 7或8裏開啟「倉頡輸入法」,無論怎麼拆碼,都輸入不到從「円」的「精」、「靖」、「晴」三字。碼不是沒有編,但根本不想你用。 | 至於「精」、「靖」、「晴」三字,從「月」的字形,分別有「7CBE」、「9756」、「6674」這三個常規編碼;從「円」的字形,則獲編作「FA1D」、「FA1C」、「FA12」。問題是,從「円」的那些「FAXX」編碼,並非常規編碼,而是「兼容區」編碼。於是,在Windows 7或8裏開啟「倉頡輸入法」,無論怎麼拆碼,都輸入不到從「円」的「精」、「靖」、「晴」三字。碼不是沒有編,但根本不想你用。 | ||
- | 以下的字更可憐:「請」、「情」、「蜻」、「靜」、「睛」、「婧」、「靚」、「瀞」、「菁」、「箐」、「倩」,它們都只有一個編碼。字型設計者要麼把它們的字形寫作從「円」,要麼寫作從「月」。除非像小塚明體等日本字型般,支援CID字庫技術,替這些Unicode裏的同碼異體字另行編碼,讓使用者在支援CID的軟件(如Adobe InDesign)裏自行選擇,否則只能二擇其一。若字型設計者,盲從台灣那套背棄正統字形的所謂「標準」,用戶根本沒機會選擇正字(從「円」者)。 | + | 以下的字更可憐:「請」、「情」、「蜻」、「靜」、「睛」、「婧」、「靚」、「瀞」、「菁」、「箐」、「倩」,它們都只有一個編碼。字型設計者要麼把它們的字形寫作從「円」,要麼寫作從「月」。除非像小塚明體等日本字型般,支援CID字庫技術,替這些Unicode裏的同碼異體字另行編碼,讓使用者在支援CID的軟件(如Adobe InDesign)裏自行選擇,否則只能二擇其一。若字型設計者,盲從臺灣那套背棄正統字形的所謂「標準」,用戶根本沒機會選擇正字(從「円」者)。 |
- | 原版「黑體-繁」並沒盲從台灣那所謂「標準」,像「請」、「晴」、「菁」、「蜻」等字它都從「円」。但像「青」(9752)、「清」(6E05)等字,爲使它看起來與「靑」(9751)、「淸」(6DF8)有分別,於是就依Unicode寫作「月」字底。這是那些「果迷」聲稱「不統一」的主因。在Windows 2000、XP年代,細明體還是細明體(未變成[[說文: | + | 原版「黑體-繁」並沒盲從臺灣那所謂「標準」,像「請」、「晴」、「菁」、「蜻」等字它都從「円」。但像「青」(9752)、「清」(6E05)等字,爲使它看起來與「靑」(9751)、「淸」(6DF8)有分別,於是就依Unicode寫作「月」字底。這是那些「果迷」聲稱「不統一」的主因。在Windows 2000、XP年代,細明體還是細明體(未變成[[說文: |
- | 既然Unicode對這些異體字的處理如此混亂,字型設計者若依從它,只會使字型也變得混亂。若說要統一這些部件的寫法,我同意。但統一的方向,應當是依照《康熙》、《說文》等正統印版字形,而非大陸或台灣那套以手寫楷字竄改印版字形的所謂「標準」。換言之,只獲編一碼的「請」、「情」等字,當寫作從「円」部件;分別被賦予兩個碼的字,不管哪個碼位,不論是「9751」還是「9752」,是「6DF8」還是「6E05」,都同樣應寫作「円」部件。如是者,整套字型裏的字形才統一。不論輸入法、軟件對編碼的支援、字型涵蓋的編碼範圍如何,使用者都能顯示出正確的傳統字形。 | + | 既然Unicode對這些異體字的處理如此混亂,字型設計者若依從它,只會使字型也變得混亂。若說要統一這些部件的寫法,我同意。但統一的方向,應當是依照《康熙》、《說文》等正統印版字形,而非大陸或臺灣那套以手寫楷字竄改印版字形的所謂「標準」。換言之,只獲編一碼的「請」、「情」等字,當寫作從「円」部件;分別被賦予兩個碼的字,不管哪個碼位,不論是「9751」還是「9752」,是「6DF8」還是「6E05」,都同樣應寫作「円」部件。如是者,整套字型裏的字形才統一。不論輸入法、軟件對編碼的支援、字型涵蓋的編碼範圍如何,使用者都能顯示出正確的傳統字形。 |
- | 然而,這種主張也有人反對。在下強烈推薦的傑兄文章〈[[http:// | + | 然而,這種主張也有人反對。在下強烈推薦的傑兄文章〈[[http:// |
對此,我看到But兄的回應有一大盲點:「『柿、杮』之別」與「『為、爲』之別」是兩個截然不同的概念,他卻弄混了。論證有訛謬,結論亦因此有誤。 | 對此,我看到But兄的回應有一大盲點:「『柿、杮』之別」與「『為、爲』之別」是兩個截然不同的概念,他卻弄混了。論證有訛謬,結論亦因此有誤。 | ||
- | <WRAP left round box> | + | <WRAP left round box miku> |
我並不反對在某些特殊情況下,有使用者要顯示異體字的不同寫法,把編碼「70BA」顯示作「為」,把「7232」顯示作「爲」。例如這一篇硏究異體字的文章,就有這種需要。但,這種特殊情況,不應影響到以下大原則:一、使用有字理依據的正統字形,是種應獲保障的權利,任何人在任何情況下都不應指鹿爲馬,把有字理依據的正統字形視爲「錯誤」。二、對印版字體而言,在一般情況下,應把寫法上有點兒差異的異體,統一作正統字形。三、能使用正統字形的機會,不應比使用各種訛俗字形低,因此若無特別指定,應以正統字形爲準。 | 我並不反對在某些特殊情況下,有使用者要顯示異體字的不同寫法,把編碼「70BA」顯示作「為」,把「7232」顯示作「爲」。例如這一篇硏究異體字的文章,就有這種需要。但,這種特殊情況,不應影響到以下大原則:一、使用有字理依據的正統字形,是種應獲保障的權利,任何人在任何情況下都不應指鹿爲馬,把有字理依據的正統字形視爲「錯誤」。二、對印版字體而言,在一般情況下,應把寫法上有點兒差異的異體,統一作正統字形。三、能使用正統字形的機會,不應比使用各種訛俗字形低,因此若無特別指定,應以正統字形爲準。 | ||
- | 要實踐這些大原則,其實不難:電腦作業系統,應以符合正統字形的字體,作系統預設字型。同時,提供各種符合不同「標準」(包括台灣「標準」、大陸「規範」、Unicode混亂異體編碼「標準」等)的字體,供使用者按需要選擇。那麼,我平時寫文章,不必擔心輸入法能否打出哪個「青」,不用憂慮軟件是否支援Big-5碼外字,不需害怕讀者的瀏覽器能否正確顯示。總之,輸入「青」字,就必定顯示出從「円」的正寫。到我有需要指定某個異體寫法,或者But兄要擧出Unicode收錄不同的字形時,則可以向軟件下指令,改爲顯示另一款包含在系統裏的字體,以應付這些特殊需要。以Windows的實況作例,目前各種符合不同「標準」的明體和黑體都有了,只要把實爲標宋體餡的細明體易名作「標宋體」,然後再提供回字形依正統寫法的正統細明體和正統黑體,作預設系統字型,問題不就解決麼? | + | 要實踐這些大原則,其實不難:電腦作業系統,應以符合正統字形的字體,作系統預設字型。同時,提供各種符合不同「標準」(包括臺灣「標準」、大陸「規範」、Unicode混亂異體編碼「標準」等)的字體,供使用者按需要選擇。那麼,我平時寫文章,不必擔心輸入法能否打出哪個「青」,不用憂慮軟件是否支援Big5碼外字,不需害怕讀者的瀏覽器能否正確顯示。總之,輸入「青」字,就必定顯示出從「円」的正寫。到我有需要指定某個異體寫法,或者But兄要擧出Unicode收錄不同的字形時,則可以向軟件下指令,改爲顯示另一款包含在系統裏的字體,以應付這些特殊需要。以Windows的實況作例,目前各種符合不同「標準」的明體和黑體都有了,只要把實爲標宋體餡的細明體易名作「標宋體」,然後再提供回字形依正統寫法的正統細明體和正統黑體,作預設系統字型,問題不就解決麼? |
- | 偏偏,現在的情況是:作業系統只提供了符合各種所謂「標準」的字型,卻不提供符合正統字形的字體!大家使用正統字形的權利被剝奪,連用正統字形的權利都沒有,更遑論無特別指定時是否以之爲準了!如是者,受着各種訛體俗字耳濡目染,連大家對正統字形的認知也越來越模糊。漸漸,大家只會擁抱着各種有問題的所謂「標準」,指鹿爲馬、顚黑倒白地,指責符合字理的正統字形是「錯字」——就像那些不學無術的「果迷」,聲稱與「標楷體」(台灣「標準」)不符的正字是「錯字」、「一整個不對」、「不應該寫成(如此)」、「毫無規則可言」、「可能是來自日文漢字的寫法」、「根本就是錯字」。也如高擧Unicode混亂異體編碼「標準」的But兄,罵與之不符的寫法是「有名的錯誤連篇」、「錯誤造字」。符合字理的正統字形,不但喪失了獲大家使用的權利,更要背負上「你是錯字」這種無稽的罵名,天有眼嗎?天,有眼乎? | + | 偏偏,現在的情況是:作業系統只提供了符合各種所謂「標準」的字型,卻不提供符合正統字形的字體!大家使用正統字形的權利被剝奪,連用正統字形的權利都沒有,更遑論無特別指定時是否以之爲準了!如是者,受着各種訛體俗字耳濡目染,連大家對正統字形的認知也越來越模糊。漸漸,大家只會擁抱着各種有問題的所謂「標準」,指鹿爲馬、顚黑倒白地,指責符合字理的正統字形是「錯字」——就像那些不學無術的「果迷」,聲稱與「標楷體」(臺灣「標準」)不符的正字是「錯字」、「一整個不對」、「不應該寫成(如此)」、「毫無規則可言」、「可能是來自日文漢字的寫法」、「根本就是錯字」。也如高擧Unicode混亂異體編碼「標準」的But兄,罵與之不符的寫法是「有名的錯誤連篇」、「錯誤造字」。符合字理的正統字形,不但喪失了獲大家使用的權利,更要背負上「你是錯字」這種無稽的罵名,天有眼嗎?天,有眼乎? |
<WRAP rightalign> | <WRAP rightalign> | ||
{{page> | {{page> | ||
- | {{tag>" | + | {{tag>" |
~~DISCUSSION~~ | ~~DISCUSSION~~ |