ASCII ASCII(American Standard Code for Information Interchange),美國信息交換標(biāo)準(zhǔn)代碼)是基于拉丁字母的一套電腦編碼系統(tǒng)。它主要用于顯示現(xiàn)代英語,而其擴(kuò)展版本EASCII則可以勉強(qiáng)顯示其他西歐語言。它是現(xiàn)今最通用的單字節(jié)編碼系統(tǒng),并等同于國際標(biāo)準(zhǔn)ISO/IEC 646。至今為止ASCII共定義了128個字符,其中33個控制字符,主要是用來操控已經(jīng)處理過的文字;95個可顯示的字符,包含用鍵盤敲下空白鍵所產(chǎn)生的空白字符(顯示為空白)。
Unicode Unicode(統(tǒng)一碼)是對世界上大部分的文字系統(tǒng)進(jìn)行了整理、編碼,使得電腦可以用更為簡化地方式來呈現(xiàn)和處理文字。統(tǒng)一碼的編碼方式與ISO 10646的通用字符集(Universal Character Set,UCS)概念相對應(yīng)。 Unicode 的實(shí)現(xiàn)方式不同于編碼方式。一個字符的Unicode編碼是確定的,但是在實(shí)際傳輸過程中,由于不同系統(tǒng)平臺的設(shè)計(jì)不一定一致,以及出于節(jié)省空間的目的,對Unicode編碼的實(shí)現(xiàn)方式有所不同。Unicode的實(shí)現(xiàn)方式稱為Unicode轉(zhuǎn)換格式(Unicode Translation Format,簡稱為 UTF)。目前實(shí)際應(yīng)用的統(tǒng)一碼版本對應(yīng)于UCS-2(UTF-16),使用16位的編碼空間。也就是每個字符占用2個字節(jié)。而字節(jié)序是指存放多字節(jié)數(shù)據(jù)的字節(jié)(byte)的順序。這里的Unicode指的是UTF-16(Little-Endian),字節(jié)序采用小端模式,最低位地址存放低位字節(jié)。