汉字如何在计算机内表示?

来源:学生作业学帮网 编辑:学帮网 时间:2024/04/29 02:05:04

汉字如何在计算机内表示?

目前在计算机中主要有两种方式来表示汉字,分别是GB2312码和big5码.
GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集--基本集》,由国家标准总局发布,1981年5月1日实施,通行于大陆.新加坡等地也使用此编码.
GB2312收录简化汉字及符号、字母、日文假名等共7445个图形字符,其中汉字占6763个.GB2312规定"对任意一个图形字符都采用两个字节表示,每个字节均采用七位编码表示",习惯上称第一个字节为"高字节",第二个字节为"低字节".GB2312-80包含了大部分常用的一、二级汉字,和9区的符号.该字符集是几乎所有的中文系统和国际化的软件都支持的中文字符集,这也是最基本的中文字符集.其编码范围是高位0xa1-0xfe,低位也是0xa1-0xfe;汉字从0xb0a1开始,结束于0xf7fe.
big5码多用于港台地区.每个字由两个字节组成,其第一字节编码范围为0xA1~0xF9,第二字节编码范围为0x40~0x7E与0xA1~0xFE,总计收入13868个字(包括5401个常用字、7652 个次常用字、7个扩充字、以及808个各式符号).
由于GB2312编码的字数太少,其后又对其进行过多次扩充,故产生了GB12345码、GBK码、GB18030码.
Big5也作了不少扩充,如CNS11643码.
编码字数统计:
GB2312 6763个汉字
GB12345 6866个汉字
GBK 21003个汉字
GB18030 27000
Big5 13053
CNS11643 48,027