Quantcast
Channel: Eric's Blog » php
Viewing all articles
Browse latest Browse all 3

GBK与GB2312的区别

$
0
0

    GBK是一个汉字编码标准,全称《汉字内码扩展规范》,于1995 年制定。GB2312是1980年国家制定的汉字内码规范。
GBK标准中收录了2万多汉字及符号,因其最早被WINDOWS采用,所以其应用范围非常广。GB2312中收录了6千多汉字及符号,通常所说的一、二级汉字库就全部包含在GB2312中。
虽然GB2312包含了绝大部分的常用简体汉字,但是由于中文的复杂性,所以GB2312目前已经越来越不能适应需要了,特别是因为人名、地名中包含的很多字GB2312中都没有,如朱镕基的‘镕’字,GB2312中就没有包含,这样导致很多混乱。
正因为GB2312的这些问题,国家标准化委员会又制定了GB13000,GB13000制定的原则与GB2312不同,GB13000以国际化为目标, 该标准编码参照了Unicode 2.0 标准编码,与GB2312完全不兼容,因早期的计算机中的汉卡采用了GB2312,无法顺利向GB13000过渡,所以GB13000变成了一个纸面上的 标准,无法推广。
    有了以上经验,国家标准化委员会制定了GBK标准,他兼容GB2312标准,同时在GB2312标准的基础上扩展了GB13000包含的字,但编码修改 了,该标准一经推出,就被WINDOWS95所采用(另一种说法是微软协助制定了此标准,这也可以印证为什么GBK标准一直没有出现在官方的标准目录 中)。因有微软的支持,该标准迅速得到广泛的应用。
GBK之后又有GB18030标准,因GB18030较GBK又多了几千汉字,码位不足,GB18030使用了2byte与4byte混合编码方式,这又给软件增加了难题,所以虽然GB18030推出了近5年,仍然没有得到广泛应用。


Viewing all articles
Browse latest Browse all 3

Latest Images

Trending Articles





Latest Images