常用國字標準字體表
中華民國教育部在1973年(民國62年)委託國立臺灣師範大學國文研究所成立專案小組,負責研訂國民常用字及標準字體。經長期的研訂和試用,在1982年(民國71年)正式啟用《常用國字標準字體表》,共計收錄4808個字[1][2]。在1996年(民國85年),教育部公佈《常用國字標準字體筆順手冊》,用國字標準字體說明常用字的筆順。
教育部正字及異體字表
- 常用國字標準字體表,簡稱甲表,ISBN 9789570906646,教育部於1978年5月印行,內附「教育部社會教育司委託國立臺灣師範大學國文研究所研訂常用國字及標準字體總報告」。收到各界意見修訂後,委由正中書局於1979年6月出版,於1982年9月1日作為常用字和字體標準正式啟用,內收4,808字。
- 次常用國字標準字體表,簡稱乙表,ISBN 9786660913003,於1982年10月印行,12月出版的次常用字和字體標準,內收6,341字。1993年公佈的《國字標準字體楷書母稿》中,次常用字為6,343字。在最新版的《異體字字典》附錄,次常用字更訂為6,329字[3]。
- 罕用國字標準字體表,簡稱丙表,ISBN 9786660913010,於1983年10月印行,隔年4月出版的的罕用字和字體標準,內收18,388字。在最新版的《異體字字典》附錄,罕用字更訂為18,319字。
- 異體國字字表,簡稱丁表,於1984年3月印行的異體字標準,內收異體18,588字,補遺22字。在最新版的《異體字字典》附錄,收異體字70,955字。
教育部國家教育研究院負責維護的《異體字字典》附錄收有〈正字表〉。該表依據教育部常用字、次常用字、罕用字三個標準字體表訂定;遇有具獨立音義而三字表未收之字形,則補收為新正字。聯綿詞為描摹語音而設,故有多種字形,其異形之用字,原則上均視為獨立正字,除非文獻明示正異關係或字構可見孳乳線索[4][5]。據《異體字字典》正式六版(2017年)所收正字編錄,計收29,921字。
研訂方法
常用國字標準字體表(甲表)
1973年2月,由「國字整理小組」擴編的「常用國字編纂處」在林尹、周何、李鍌、陳新雄、李殿魁、張文彬、大成、王熙元、胡自逢、許錟輝、黃永武、黃慶萱等文字學學者的領導下,著手進行常用標準國字的整理工作。其收字及選字標準為,從中文大辭典編纂處 「總字表」(49905字)、師大國文研究所「常用字表」(2408字)及教育部「國民學校常用字彙表」(4864字)中,合併統計其總出現次數,再參酌各方意見修訂而成[4][6][1][7]。
- 常用字資料來源及其出現次數表:從「總字表」出現次較多之字挑選出7980字,結合「常用字表」,並合併「國民學校常用字彙表」[註 3]之字頻統計。
- 國民常用字調查表:以「常用字資料來源及其出現次數表」選定之7980字為基礎,將「常用字表」與「國民學校常用字彙表」二者出現次的總和作為總出現次。依出現總次的高低排序,合併正俗字,選出其中最常用的4708字製成,此為初步統計結果。1978年(民國67年)教育部參酌各方意見將字表增訂至4808字,定名為《常用國字標準字體表》。
字元編碼及字體電腦化
1980至1987年間,由中研院中美科學學術合作委員會與文建會(後升格為文化部)贊助的「資訊應用國字整理小組」發布《中文資訊交換碼》,納編53,940個漢字,包括:正體常用字4,808、正體備用字17,032、異體常用備用字11,517和正體罕用字20,583[11]。正體常用字即為《常用國字標準字體表》的4,808字[12]。
1986年,中央標準局公佈《通用漢字標準交換碼》(後更名為《中文標準交換碼》)納編「常用及次常用字」,共計13,051字,成為中文資訊處理交換碼納編字數的國家標準[1]。該標準的第一字面字集(5,401字)編入《常用國字標準字體表》及常見的「國中小教科書常用字」,第二字面字集(7,650字)編入《次常用國字標準字體表》及使用頻率較高的「罕用國字」[13]。《中文標準交換碼》日後陸續擴編,目前大約有96,600多個漢字[14][15]。繁體中文資訊處理編碼的業界標準五大專案碼(BIG-5)則是以《通用漢字標準交換碼》的前身「常用字碼集」為藍本而設計,於1983年12月推出[16]。
教育部在公開招標評比後,於1991年委託華康科技公司製作《常用字表》及《次常用字表》楷、宋、黑、隸等體的電腦母稿。1993年6月,教育部公布了《國字標準字體楷書母稿》及《國字標準字體宋體母稿》。隔年,教育部發布其電子字型檔[1]。1998年公布《國字標準字體方體母稿》(方體指不含圓體的黑體)和《國字隸書母稿》。1999年公布《國字標準字體宋體母稿增補編》。
比較
中央標準局所公佈的《通用漢字標準交換碼》(後更名為《中文標準交換碼》,CNS11643)与1984年发布的业界事实标准五大碼 (Big5) 有些许共同之处:两者都使用國字標準字體表为基础,但是《中文標準交換碼》所定义的码位更符合國字標準字體表所选定的字形。國字標準字體表本身并未定义字形的码位,而是依赖于其他标准将字形赋予码位。
其中,五大碼与现在的《中文標準交換碼》有部分收字差异:
國字 | 字表序號[18] | CNS11643 | Big5收录异体 | 備註 |
---|---|---|---|---|
U+5F5E彞 | A01266 | 1-7641 | C255,U+5F5D彝 | |
U+53C4叄 | B00287 | 3-3455 | 五大碼未收录 | |
U+564D噍 | B00439 | 3-4B43 | 五大碼未收录 | |
U+36B7㚷 | B00635 | 3-2847 | 五大碼未收录 | |
U+5B0E嬎 | B00715 | 3-4B5F | E955,U+5B14嬔 | CNS11643 第二字面 2-565F 疑似誤收 U+5B14嬔 字,但是显示为无点的 U+5B0E嬎 |
U+5C14尔 | B00760 | 3-223F | 五大碼未收录 | |
U+3BA3㮣 | B01783 | 3-4167 | 五大碼未收录 | |
U+7934礴 | B03027 | 2-662B | F2A1,U+7921礡 | 疑似 Unicode 統合時錯誤對應到統合漢字 U+7921礡 上 |
U+7DF5緵 | B03452 | 3-4E2B | EDDB,U+7E4C繌 | CNS11643 第二字面 2-5E48 疑似誤收 U+7E4C繌 字 |
U+9638阸 | B05531 | 4-2833 | 五大碼未收录 | |
U+9C0C鰌 | B05989 | 3-5D76 | 五大碼未收录 |
其他
2000年,教育部出版《國小學童常用字詞調查報告書》[19],該研究透過對學童常用讀物的字頻和詞頻統計,調查出當時國小學生常用的5,021字。該報告書後來編纂為《教育部常用字庫辭典》,成為教育部識字量測驗的資料庫來源。
2012年,中華文化總會推出中華語文知識庫,其「漢字源流彙編」收錄常用漢字3,000字,並依次列舉甲骨文、金文、 戰國文字、小篆、隸書、楷書六種字體,說明漢字形體之演變[20]。
2013年,教育部委託國家教育研究院推動「建置應用語料庫及標準體系」的華語文教育計畫。研究團隊召開多次學者專家的諮詢會議,又依據語料庫的統計成果並徵求資深華語文教師的意見,在2020年完成了「臺灣華語文能力基準」的訂定,作為非母語人士學習華語的能力指標及分級標準之憑據。該指標分為三等七級,其字表部份總計收錄3,100字[21]。
2018年,國家教育研究院出版《九十九年常用語詞調查報告書》和《一○○至一○四年常用語詞調查報告書》,調查2010年至2015年採錄語料的字頻、詞頻,並和《常用國字標準字體表》加以比較。以2015年為例,其字頻表採集到5,289字,字頻10以上的字數為3,404字,而《常用國字標準字體表》未收錄但字頻達10以上之高頻字,共計117字。另外,在2010年至2015年各年度的字頻表中,字頻10以上的字數,介於3,269字至3,410字之間。與教育部《常用國字標準字體表》比較,每年均出現而未收錄於該表的高頻單字有21 個[22]。
標準、課綱和華語考試
根據教育部在1994年委託執行的「我國失學國民脫盲識字標準及脫盲識字字彙之研究」,台灣一般成人日常生活所需之基本字彙為2,328字,基本字為1659字,次基本字為669字。凡解讀日常生活基本字彙之能力在 470 個字以下者,列為「不識字」;能認 870 個字以上,而未達 1,680 字者為「半識字」;能認 1,680 字,並具有書寫日常生活之簡單應用文字能力者為「識字者」,可視為脫離文盲。[23][24]
十二年國民基本教育課程綱要(108課綱)規定在第一學習階段(國小 1-2 年級)認識常用國字至少 1,000 字,使用 700 字。第二學習階段(國小 3-4 年級)認識常用國字至少 1,800 字,使用 1,200 字。第三學習階段(國小 5-6 年級)認識常用國字至少 2,700 字,使用 2,200 字。第四學習階段(國中 7-9 年級)認識國字至少 4,500 字,使用 3,500 字。
華語文能力測驗所參照的臺灣華語文能力基準,是為外國人學習華語所制定,規定基礎(1-3級)要瞭解246~801個漢字,進階(4-5級)要瞭解1300~1900個漢字,精熟(6-7級)要瞭解2500~3100個漢字。
註釋
參考文獻
- 曾榮汾. (PDF). . 文字學學術研討會. 1994 [2021-05-14]. (原始内容存档 (PDF)于2021-05-07).
-
- 曾榮汾 & al., 國字標準字體(教師手冊) (页面存档备份,存于),中華民國教育部,ISBN 957-00-4240-0
- 1979年(甲):常用國字標準字體表;
- 1982年(乙):次常用國字標準字體表。
- 李鍌 & al., 常用國字標準字體筆順手冊 (页面存档备份,存于)(序 (页面存档备份,存于)),中華民國教育部,1995. Book available online (authoritative work). ISBN 957-00-7082-X
- 曾榮汾 & al., 國字標準字體(教師手冊) (页面存档备份,存于),中華民國教育部,ISBN 957-00-4240-0
- . [2021-05-14]. (原始内容存档于2021-05-14).
其中有5字不可考(幽靈漢字)。在目前教育部異體字字典的附錄中,已被改收至〈待考正字表〉。另有9字為單位符號,改收至〈單位詞參考表〉。扣除這14字後,共6,329字
- 李添富. . 東洋學. 2018, 71 [2021-05-14]. (原始内容存档于2021-05-14).
- 巫俊勳. (PDF). 政大中文學報. 2019, 32: 315–358.
- 李添富. (PDF). 世界漢字學會第四屆年會“表意文字體系與漢字學科建設”國際學術研討會. 2016-06-24~2016-06-28.
- 世界華文教育協進會. . 世界華文出版社. 1985: 614-614 [2021-05-14]. (原始内容存档于2021-05-14).
常用字的選字即以中文大辭典編纂處的「總字表」(四九九O五字),委員會研訂之「常用字表」(二四O八字),及教育部「國民學校常用字彙表」(四八六四字),合併統計其總出現次數,於民國六十四年九月十五日正式完成「國民常用字表」
- 國家教育研究院. . 元照. 2018 [2021-05-14]. (原始内容存档于2021-05-14).
- 林佑玫. (PDF). 國立臺中教育大學語文教育研究所. 2010 [2021-05-15]. (原始内容存档 (PDF)于2021-05-15).
- 黃沛榮. . 華文世界. 1991, 62: 18–26.
- 曾世熊. . . [2022-12-22]. (原始内容存档于2022-12-18).
- . [2022-12-22]. (原始内容存档于2020-10-20).
- . [2021-05-14]. (原始内容存档于2021-05-14).
- . [2022-12-22]. (原始内容存档于2023-01-27).
- . [2022-12-22]. (原始内容存档于2022-12-17).
現有字數:現行全字庫中,戶政與地政部分用字經檢查為認同字,因而刪除該碼位資料,但仍保留該碼位的位置,現有字數即去除這些被認同掉的字碼,所計算得到的總字數……全字庫第八字面和第九字面所儲存的是拼音文字,所以沒有注音、倉頡等屬性資料碼位個數
- 行政院主計資訊處. . [2023-09-04]. (原始内容存档于2023-09-04).
- . zi-hi.com. [2023-04-25]. (原始内容存档于2021-05-14).
- 国家教育研究院. . [2021-05-14]. (原始内容存档于2021-05-15) (中文(臺灣)).
- . [2021-05-20]. (原始内容存档于2021-05-20).
- . [2022-02-21]. (原始内容存档于2022-05-17).
- (PDF). 國家教育研究院. 2020 [2021-05-20]. (原始内容存档 (PDF)于2021-06-25).
- . [2023-12-16]. (原始内容存档于2023-12-16).
- . [2023-12-16]. (原始内容存档于2023-12-16).
- 黃富順. (PDF). 成人教育. [2023-12-16]. (原始内容存档 (PDF)于2023-12-16).
外部連結
字表
- 《常用國字標準字體表》(4,808字) (页面存档备份,存于)
- 《異體字字典》正字表(29,921字) (页面存档备份,存于)
- 《中文標準交換碼》第一字面(5,401字) (页面存档备份,存于)
- 《教育部常用字庫辭典》(5,021字) (页面存档备份,存于)
- 「華語文能力基準」漢字表(3,100字) (页面存档备份,存于)
- 「漢字源流」常用漢字(3,000字) (页面存档备份,存于)
筆順
- 國字標準字體筆順學習網 (页面存档备份,存于)
- 筆順字典 - 國字筆順查詢筆順動畫演示漢字筆順學習網 (页面存档备份,存于)
其他
- 國字標準字體教師手冊
- 教育部語文成果網 - 字形類 (页面存档备份,存于)
- 日本・中国・台湾・香港・韓国の常用漢字と漢字コード (页面存档备份,存于) (日語)