1.名称:
gb 2312-1980(信息交换用汉字编码字符集 基本集)
gbk-1995(汉字内码扩展规范)
gb13000.1-1993(信息技术 通用多八位编码字符集(ucs)第一部分:体系结构与基本多文种平面(idt iso/iec 10646.1-1993))
gb 18030-2000(信息交换用汉字编码字符集 基本集的扩充)
2.关系:
gb 18030完全兼容gbk、gb2312,并且是后二者的替代标准,也将是今后唯一的字符集国家标准。
gb 18030和gb13000.1的关系:在字汇上兼容,码表则不兼容。例如,两个标准中都会有“啊”字,但两个标准中,“啊”的内码是不同的。
gb13000.1和iso10646为同一体系,与工业标准unicode3.1是兼容的。
3.gb18030:
该标准分为两个部分:双字节部分和四字节部分。
双字节部分和gbk基本完全相同。
四字节部分到目前为止,比gbk多了6582个汉字(27484-20902),x8139ef30~0x82358738。对应gb13000.1则为0x3400~0x4db5。
4.目前支持gb18030的os:
2001年9月1日后的windows2000 的补丁版;
windows xp;
以及一些linux、unix的os。
5.gb18030的问题
由于gb18030中包括了4字节编码汉字,和目前windows平台中普遍使用的2字节编码的gbk和unicode3.1有较大区别,因此在使用中出现了很多问题。例如微软的windows xp中实际上只支持unicode3.1编码,并不支持gb18030的4字节编码汉字。