ASCII

ASCII發音: /ˈæski/ ASS-kee[1],,)是基于拉丁字母的一套电脑字符编码标准。它主要用于显示现代英语,而其擴展版本延伸美国标准信息交换码則可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646

美国信息交换标准代码是这套编码标准的传统命名,互联网号码分配局现在更倾向于使用它的新名字[2]

美国信息交换标准代码是美國電氣和電子工程師協會里程碑之一。

ASCII 由电报码发展而来。第一版标准发布于1963年[3][4],1967年经历了一次主要修订[5][6],最後一次更新則是在1986年,至今為止共定義了128個字元;其中33個字元無法顯示(一些终端提供了扩展,使得这些字符可顯示为諸如笑臉、撲克牌花式等8-bit符號),且這33個字元多數都已是陳廢的控制字元。控制字元的用途主要是用來操控已經處理過的文字。在33個字元之外的是95個可顯示的字元。用鍵盤敲下空白鍵所產生的空白字元也算1個可顯示字元(顯示為空白)。

技术背景

在计算机中,所有的数据在存储和运算时都要使用二进制数表示。例如,像a、b、c、d这样的52个字母(包括大写)以及0、1等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,这就是编码。如果不同的计算机要想互相通信而不造成混乱,那么每台计算机就必须使用相同的编码规则,于是美国有关的标准化组织就推出了ASCII编码。

ASCII是由美国国家标准学会(American National Standard Institute,ANSI)制定的,使用标准的单字节字符编码方案,用于基于文本的数据。方案起始于50年代后期,在1967年定案。它最初是美国的标准,供不同计算机在相互通信时需共同遵守的西文字符编码标准。现已被国际标准化组织(International Organization for Standardization,ISO)定为国际标准(ISO/IEC 646),适用于所有拉丁字母。

控制字符

ASCII控制字符的编号范围是0-31和127(16进制:0x00-0x1F和0x7F),共33个字符。

为方便人类用户阅读,各个控制字符均有Unicode表示法和脫出字元表示法:

  • Unicode表示法:當想在畫面或紙上表示這些控制字元時,就會顯示成這個樣子。過於老舊的系統或瀏覽器可能會看不到。使用微軟任一中文輸入法,輸入`U2400即可看到␀,輸入`U2401可看到␁,依此類推。
  • 脫出字元表示法:通常用於終端機連線(例如Telnet通訊協定),以脫出字元^開頭,再接一個符號,用來讓這些控制字元得以在畫面上顯現。雖然看起來是兩個字元,但在終端機上實際只有一個字元。在絕大部分的終端機系統中,包括Windows命令提示字元(cmd.exe)、LinuxFreeBSD,都可用Ctrl代表脫出字元,輸入想要的ASCII控制字元。例如想輸入空字符,就要輸入Ctrl+2,而非^@,後者會顯示成兩字元,前者只會顯示成一字元。
ASCII控制字符(共33个)
二进制 十进制 十六进制 缩写 Unicode
表示法
脫出字元
表示法
名称/意义
0000 0000000NUL^@ 空字符(Null)
0000 0001101SOH^A 标题开始
0000 0010202STX^B 本文开始
0000 0011303ETX^C 本文结束
0000 0100404EOT^D 傳輸结束
0000 0101505ENQ^E 请求
0000 0110606ACK^F 確認回應
0000 0111707BEL^G 响铃
0000 1000808BS^H 退格
0000 1001909HT^I 水平定位符號
0000 1010100ALF^J 换行键
0000 1011110BVT^K 垂直定位符號
0000 110012 0CFF ^L 换页键
0000 110113 0DCR ^M CR (字元)
0000 111014 0ESO ^N 取消變换(Shift out)
0000 111115 0FSI ^O 启用變换(Shift in)
0001 000016 10DLE ^P 跳出数据通讯
0001 000117 11DC1 ^Q 設備控制一(XON 啟用軟體速度控制
0001 001018 12DC2 ^R 設備控制
0001 001119 13DC3 ^S 設備控制三(XOFF 停用軟體速度控制
0001 010020 14DC4 ^T 設備控制
0001 010121 15NAK ^U 確認失敗回應
0001 011022 16SYN ^V 同步用暫停
0001 011123 17ETB ^W 區塊傳輸结束
0001 100024 18CAN ^X 取消
0001 100125 19EM ^Y 連線介质中断
0001 101026 1ASUB ^Z 替換
0001 101127 1BESC ^[ 退出键
0001 110028 1CFS ^\ 文件分割符
0001 110129 1DGS ^] 群組分隔符
0001 111030 1ERS ^^ 记录分隔符
0001 111131 1FUS ^_ 单元分隔符
0111 1111127 7FDEL ^? Delete字符

可显示字符

可显示字符编号范围是32-126(0x20-0x7E),共95个字符。

32~126(共95个)是字符(32是空格),其中48~57为0到9十个阿拉伯数字。

65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

ASCII可显示字符(共95个)
二进制 十进制 十六进制 图形
0010 000032 20 (space)
0010 000133 21!
0010 001034 22"
0010 001135 23#
0010 010036 24$
0010 010137 25%
0010 011038 26&
0010 011139 27'
0010 100040 28(
0010 100141 29)
0010 101042 2A*
0010 101143 2B+
0010 110044 2C,
0010 110145 2D-
0010 111046 2E.
0010 111147 2F/
0011 000048 300
0011 000149 311
0011 001050 322
0011 001151 333
0011 010052 344
0011 010153 355
0011 011054 366
0011 011155 377
0011 100056 388
0011 100157 399
0011 101058 3A:
0011 101159 3B;
0011 110060 3C<
0011 110161 3D=
0011 111062 3E>
0011 111163 3F?
二进制 十进制 十六进制 图形
0100 000064 40@
0100 000165 41A
0100 001066 42B
0100 001167 43C
0100 010068 44D
0100 010169 45E
0100 011070 46F
0100 011171 47G
0100 100072 48H
0100 100173 49I
0100 101074 4AJ
0100 101175 4BK
0100 110076 4CL
0100 110177 4DM
0100 111078 4EN
0100 111179 4FO
0101 000080 50P
0101 000181 51Q
0101 001082 52R
0101 001183 53S
0101 010084 54T
0101 010185 55U
0101 011086 56V
0101 011187 57W
0101 100088 58X
0101 100189 59Y
0101 101090 5AZ
0101 101191 5B[
0101 110092 5C\
0101 110193 5D]
0101 111094 5E^
0101 111195 5F_
二进制 十进制 十六进制 图形
0110 000096 60`
0110 000197 61a
0110 001098 62b
0110 001199 63c
0110 0100100 64d
0110 0101101 65e
0110 0110102 66f
0110 0111103 67g
0110 1000104 68h
0110 1001105 69i
0110 1010106 6Aj
0110 1011107 6Bk
0110 1100108 6Cl
0110 1101109 6Dm
0110 1110110 6En
0110 1111111 6Fo
0111 0000112 70p
0111 0001113 71q
0111 0010114 72r
0111 0011115 73s
0111 0100116 74t
0111 0101117 75u
0111 0110118 76v
0111 0111119 77w
0111 1000120 78x
0111 1001121 79y
0111 1010122 7Az
0111 1011123 7B{
0111 1100124 7C|
0111 1101125 7D}
0111 1110126 7E~

缺點

ASCII的局限在於只能顯示26個基本拉丁字母、阿拉伯數字和英式標點符號,因此只能用於顯示現代美國英語(且處理naïve、café、élite等外來語時,必須去除附加符號)。雖然EASCII解決了部分西歐語言的顯示問題,但對更多其他語言依然無能為力。因此,現在的软件系统大多采用Unicode,特别是与ASCII向下兼容的UTF-8

参见

参考资料

  1. ASCII的口語發音 页面存档备份,存于. Merriam Webster. Accessed 2008-04-14.
  2. Internet Assigned Numbers Authority (IANA) (May 14, 2007). "Character Sets 页面存档备份,存于". Accessed 2008-04-14.
  3. Brandel, Mary. . CNN. July 6, 1999 [2008-04-14]. (原始内容存档于2013-06-17).
  4. . American Standards Association (ASA). 1963-06-17 [2018-09-28]. (原始内容存档于2018-09-28).
  5. . United States of America Standards Institute (USASI). July 7, 1967.
  6. Jennings, Thomas Daniel. . World Power Systems (WPS). 2016-04-20 [1999] [2018-09-28]. (原始内容存档于2018-09-28).
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.