国家标准信息交换汉字编码(国家标准信息交换汉字编码查询)
《信息交换用汉字编码字符集》(GB2312-80)是什么码?
GB2312-80把汉字分成两个等级:一级汉字与二级汉字
区码:1~8是符号区,全角英文字母,希腊、日文、俄文等等,
9区是造表符号
10~15空,未定义,
16~55一级字库汉字3755个,采用拼音排序;
56-87二级字库,汉字3008个,采用部首排序;
87~94空
每一个汉字有一个全国统一的代码。
区位码是一个四位的十进制数,它的前两位叫做区码,后两位叫做位码。
汉字库分布情况如下:
一级汉字16-55区
二级汉字56-87区
区位码加上2020H,就得到国标码。
国标码加上8080H,就得到常用的计算机机内码。
交换码由几个字节组成?
答案是两个字节
国标码又称为汉字交换码,在计算机之间交换信息用。用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为214=16384个。
将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20),便得到国标码。例如“中”字的国标码为8680(十进制)或7468(十六进制)。这就是国家标准局规定的GB2312—80信息交换用汉字编码集。
交换码和机内码有什么区别?
交换码:计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。而二进制代码使用起来是不方便的,于是需要采用信息交换码。我国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码。
内码:根据国标码的规定,每一个汉字都有了确定的二进制代码,但是这个代码在计算机内部处理时会与ASCII码发生冲突,为解决这个问题,把国标码的每一个字节的首位上加1。由于ASCII码只用7位,所以,这个首位上的“1”就可以作为识别汉字代码的标志,计算机在处理到首位是“1”的代码时把它理解为是汉字的信息,在处理到首位是“0”的代码时把它理解为是ASCII码。
汉子国际码(GB2312-80)把汉字分成几个等级?
两个等级:一级汉字和二级汉字。GB2312-80:《信息交换用汉字编码字符集》的国标交换码,标准号是:GB 2312—1980。其中选入了6763个汉字,分为两级。一级字库中有3755个,是常用汉字;二级字库中有3008个,是次常用汉字。同时,GB 2312收录了包括拉丁字母、希腊字母、日文,俄文字母在内的682个全角字符。其中,一级常用汉字按汉语拼音规律排列,二级次常用汉字按偏旁部首规律排列。扩展资料:《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是:GB 2312—1980。GB2312-80收录的汉字可以覆盖中国大陆99.75%的使用频率,基本上满足了汉字的计算机处理需要。
GB2312-80对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这就是区位码。其分区为:01-09区为特殊符号;其中1—8 是符号区,一般符号,拉丁字母,希腊、日文、俄文、汉语拼音等,9 区是图形符号;10-15区为空,备用区16-55区为一级汉字;56-87区为二级汉字;88-94区为空,备用区。
2005版汉字编码国标?
全称:国家标准 GB 18030-2005《信息技术中文编码字符集》,是中华人民共和国目前最新的内码字符集,是GB 18030-2000《信息技术 信息交换用汉字编码字符集基本集的扩充》的修订版。与GB 2312-1980 完全兼容,与GBK 基本兼容,支持GB 13000及 Unicode的全部统一汉字,共收录汉字70244个。