阅读文章

汉字扩展内码规范— gbk-乐鱼app体育下载

汉字扩展内码规范— gbk

[日期:2008-04-23] 来源:  作者: [字体: ]

》广告》彩盒礼盒食品包装盒定制》 金鹰盒工厂:湘潭市金鹰彩色印刷有限公司专注于食品包装盒的设计、生产和研发,主要生产蛋糕盒、西点盒、糕点盒、特产盒、粽子盒、月饼盒、年礼盒、茶叶盒,是湖南较早湘潭唯一一家获得食品相关产品食品用纸包装容器生产许可证的企业。彩盒礼盒定制热线:13973284032(胡敬禹先生 语言文字网站长,1995年毕业于长沙理工大学印刷专业,一直从事于印刷包装行业)《彩盒礼盒食品包装盒定制《广告《

国际标准化组织为了将世界各民族的文字进行统一编码,制定了ucs标准。根据这一标准,中、日、韩三国共同制定了《cjk统一汉字编码字符集》,其国际标准号为:iso/iec10646,国家标准号为:gb13000-90,该汉字编码字符集就是通常人们所说的大字符集,它编入了20902个汉字,收集了大陆一二级字库中的简体字,台湾《通用汉字标准交换码》中的繁体字,58个香港特别用字和92个延边地区朝鲜族“吏读”字,甚至涵盖了日文与韩文中的通用汉字,满足了方方面面的需要。windows95/98/nt/2000中都装入了大字符集汉字库,人们一般称它为gbk(“国家标准扩展”的拼音缩写)。

汉字扩展内码规范--gbk 的目的是解决汉字收字不足、简繁同平面共存、简化代码体系间转换等汉字信息交换的瓶颈问题,并在保持已有应用软件兼容性的前提下,向最终的国际统一双字节字符集标准 iso10646.1 迈进。

1.扩展的汉字内码规范的原则

与 《信息交换用汉字编码字符集--基本集》即国家标准 gb2312-80 的内码体系标准完全兼容。

在字汇一级支持 iso 10466.1/《cjk统一汉字编码字符集》即国家标准 gb13000.1 的全部 cjk 汉字。

非汉字符号同时涵盖大部分常用的big5 非汉字符号。

2.规范的名称与简称

中文名称:汉字内码规范

英文名称:chinese internal code specification

简称: gbk ( k 是“扩展”的汉语拼音第一个字母)

3.规范的内容

适用范围:

作为非 ucs (iso 10646) 体系的代码页(code page),适用于中文信息的处理、交换、存储、显现、输入和输出。

字汇:

gb2312-80 的全部汉字、非汉字符号。

gb13000.1中的其他cjk 汉字。

以上两项合计为 20902 个 gb 化汉字。

《简化字总表》中尚未收入 gb 13000.1 的 52 个汉字;即,gbk 不但能包括《现代汉语通用字表》的全部七千个汉字,还能够包含《简化字总表》中的全部简体字及其对应的繁体字。

  《康熙字典》及《辞海》中尚未收入 gb 13000.1 的部首及重要构件共 28 个。

  13 个汉字结构符。

  《big5 》中未被 gb2312--80 收入的、单在 iso 10646.1 中存在的图形符号 139 个。

  正式收入带音调的拼音字母 30 个和 ɑ、ɡ(按 gb 12345-90 印刷本)。

汉字“o”(gb13001.1代码 0x3007“零”)。

  gb 12345-90 中编码的竖排标点符号 19 个,但凡是 ucs 中没有编码的暂不收入。

从 iso 10646.1/gb 13000.1 的 cjk 兼容区挑选出来的 21 个汉字,以保证若干 big5 (tcacns11643) 文件、jis 文件及 ibm 文件在双向往返转换中不致丢失信息。

31 个 ibm os/2 专用符号,凡是 iso 10646.1/gb 13000.1 已经收入的全部收入或认同。

汉字字序

gb2312-80 的汉字仍然按照原有的 i 级字,ii 级字,分别按拼音、部首/笔画排列。

gb13000.1 的其他cjk汉字,按 ucs 代码大小顺序排列。

追加的80个汉字、部首/构件,与上述两类字汇分开,按康熙字典页码.字位单独排列。

码位分配

总体采用 8140-fefe 的矩形区域,剔除 xx7f 一条线,共 23940 个码位。

汉字区:21008 个码位。gb2312-80汉字区 b0a1-f7fe,6768个码位, 6763个汉字;gb13000.1扩充汉字区 8140-a0fe的矩形区,剔除 xx7f, 6080 个码位;aa40-fea0,剔除 xx7f, 8160 个码位,其中, 21 个 cjk 兼容汉字编码在 fd9c-fe4f; 80 个增补汉字/部首/构件在 fe50-fea0。

图形符号区:1038 个码位。gb2312-80非汉字区 a1a1-a9fe,846 个码位,除了原有的标准字符外,其中还有: 10 个小写罗马数字《补充在 a2a1-a2aa, 30 个带音调拼音字母及 ɑ、ɡ安排在 a8a1-a8c0, 19 个竖排符号安排在 a6e0-a6f5 之间。gb13000.1 扩充非汉字区a840-a9a0,剔除 xx7f,192 个码位,big5 非汉字字符、结构符和“o”排列在此区域。

用户自定义区: 1894个码位,aaa1-affe的矩形区, 564 个码位;f8a1-fefe的矩形区, 658 个码位,a140-a7a0 的矩形区, 672 个码位 (剔除 xx7f)。

gbk 与 gb 13000.1 的对应关系

汉字区和图形符号区的所有字符,都与 gb 13000.1 已经编码的字符一一对应。

52 个追加汉字、28 个部首/构件以及 13 个结构符均暂时对应于 gb 13000.1 的专用区( private use area, e000-f8fe),如果今后这些字符正式收入了 iso 10646/ gb 13000,本规格将作相应修改。

带音调的拼音字母,与 gb 13000.1 中 a_zone 的 latin 编码字符相对应;与 gb 13000.1 不能对应的两个字母,有待向 sc2/wg2 申请码位。

gbk 的字形

gbk 字形要与 iso 10646.1/gb 13000.1 保持一致。

在 cjk 汉字认同规则的总框架内,选用“无重码正形”后的(gb 化)的汉字字形。




阅读: 次
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整乐鱼全站app官网入口的版权,在语网的发布不影响其再乐鱼全站app官网入口的版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及乐鱼全站app官网入口的版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 】
上一篇:什么是gb、big5、gbk、gb18030字集?

下一篇:gbk 汉字内码扩展规范编码表
相关文章       汉字 
本文评论
  22624   (湘里伢子会员 ,04月10日 )
  好家伙   (刘子涵 ,2021-09-26 )
  既然是国家强制性标准,为什么要收费才能阅读,为什么不能广而告知? 作者: julia 2007-2-4 13:09:58 等级: ★   既然是国家强制性标准,为什么不能广而告之提供免费下载,反而需要购买?直到今天我才知道gb18030-2005已经取代了gb18030-2000,但具体的内容有多少人知道呢?不知道又何谈遵守呢?期间听说还出过国家强制性标准gb18030-2001,但有操作系统和字处理软件真正支持这个标准吗?gb18030-2005的适用范围是什么?是需要所有的应用软件比如游戏、杀毒、集群软件都支持gb18030-2005吗?      盼有关部门给予答复。 http://www.spc.net.cn/review/review.asp?strid=28735   (湘里伢子会员 ,2008-04-23 )
  反对gb 18030作为国家标准 作者: 张轴材 代 郑珑等人 2006-10-10 15:04:06 等级: ★★★★★   诸位:      尽管下述意见众所周知,但我还是再说一遍,不准确之处望指正。      在gb18030-2005这个标准中,汉字的编码不符合iso/iec 10646:2003汉字编码字符集这一国际标准,在今天我国已加入wto,大家都离不开国际互联网的时代,这标准出台的本身就是一个错误的技术路线,起着误导和阻碍我国中文信息技术发展的作用,幸亏大家都没有执行,因为连制订这一标准的部门自己都无法执行。而且这一标准也不符合“中国标准创新贡献奖”中“奖励范围”的规定,因此我坚决反对该标准获取“中国标准创新贡献奖”!奖励范围规定:(一)截止2006年9月1日,经相应主管部门批准发布、备案并已实施一年以上(含一年)的国家标准项目、行业标准项目、地方标准项目、企业标准项目。(二)被国际标准化组织(包括iso、iec、itu及其他认可的国际组织)采纳且已经批准发布为国际标准的项目。”      因为:(一)在gb18030-2005的标准手册上印着“2005-11-08”发布、“2006-05-01实施”。 且该手册是2006年8月第一次印刷,根本不够“实施一年以上”的要求;(二...   (湘里伢子会员 ,2008-04-23 )
  gb18030是技术的倒退 作者: 张轴材 2006-10-10   关于对首届"中国标准创新贡献奖"     奖励项目gb18030-2005的严重质疑      1. 该标准的体系结构存在严重问题;早有报告。      2. 该标准与gb 13000(等同于我国长期参与、跟踪、主导的国际标准iso/iec 10646=unicode)等国际主流标准完全不兼容,却是人为的强制性标准,已经造成混乱,将严重阻碍信息技术发展。      3. 信息技术界、中文信息学会、国家语委多次提出反对意见,标准制定单位置若罔闻,搞小圈子,压制不同意见,造成严重恶果。      4. 标准制定单位采取欺上瞒下等不正当手段,封锁长期在该领域工作的国家工作组成员,用虚伪政治口号误导领导,不敢面对严肃的技术问题,致使标准中错误百出。      5. gb 18030-2005的文本才出版5个月、 “创新贡献奖”选在国庆长假前夕公布,10天中7天假,不可能有充裕的时间征得公众意见。而与国际标准等同的gb 13000-2005则被主办单位扣押,致使公众无从比较优劣。      6. gb 18030所选汉字,乃是gb 13000十余年来国内外专家长期工作认同、甄别的结果,gb 18030小组信手拈来,胡乱编码而已,何来创...   (湘里伢子会员 ,2008-04-23 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章  
 
网站地图