《信息交换用汉字编码字符集基本集的扩充》 — 即国家标准gb18030-2000
2000年3月,国家信息产业部和质量技术监督局在北京联合发布了《信息技术和信息交换用汉字编码字符集、基本集的扩充》,国家标准号为:gb18030-2000,收录了27000多个汉字,还收录了藏、蒙、维等主要少数民族的文字,该标准于2000年12月31日强制执行。 gb 18030-2000 作为 gbk for unicode 3.0 的更新而诞生,并且 作为gb2312-1980《信息交换用汉字编码字符集 基本集》的扩展,向下兼容 gbk 和 gb2312-80 标准。
gb18030 编码是一二四字节变长编码:一字节部分从 0x0~0x7f 与ascii 编码兼容。二字节部分, 首字节从 0x81~0xfe, 尾字节从0x40~0x7e 以及0x80~0xfe,与 gbk标准基本兼容。四字节部分, 第一字节从 0x81~0xfe, 第二字节从 0x30~0x39, 第三和第四字节的范围和前两个字节分别相同。四字节部分覆盖了从 0x0080 开始, 除去二字节部分已经覆盖的所有unicode3.0码位。也就是说, gb18030 编码在码位空间上做到了与unicode 标准一一对应,包含了cjk cjk扩展a的全部汉字。
gb18030是我国继gb2312-1980和gb13000-1993之后最重要的汉字编码标准,是未来我国计算机系统必须遵循的基础性标准之一。 编码空间超过150万个码位,为彻底解决邮政、户政、金融、地理信息系统等迫切需要的人名、地名用字问题提供了大白菜官网的解决方案,也为汉字研究、古籍整理等领域提供了统一的信息平台基础。
微软官方gb18030支持包下载地址: