汉字编码字符集
汉字编码字符集
,在
中文信息处理
领域,指按照规则定义的
汉字
的有序
集合
。
[1]
指定字符集中的
漢字編碼
是指汉字在该字符集中对应的
字符编码
。
常见的包含汉字的编码字符集有:
现在通行的
Unicode
,基本等同
ISO 10646
。包含一些
中日韩统一表意文字
。
万国码常见的编码形式有
UTF-8
和
UTF-16
。
日语曾使用的几种
Shift JIS
码
用于书写记录
汉语
的:
台湾
大五码
,记载
繁体中文
,有多种分支、拓展形式。
香港有
HKSCS
拓展及其前身
GCCS
。
中国大陆
国标码
,一般用于记载
简体中文
。
GB 2312-80
,容纳常用简体字,常用
EUC-CN
形式。
GBK
,由微软扩展到 Unicode 1.0 全部汉字。
GB 18030
,扩展到可以表示所有万国码字符。
参见
字碼
內碼
参考资料
中文信息处理技术教程 清华大学出版社
参阅
Lunde, Ken.
. 2nd. O'Reilly. 2009
[
2017-04-03
]
.
ISBN
9780596514471. (原始内容
存档
于2020-08-01).
This article is issued from
Wikipedia
. The text is licensed under
Creative Commons - Attribution - Sharealike
. Additional terms may apply for the media files.