自由博客unicode转换器,可以将unicode转换为gb2312汉字,或者将gb2312汉字转换为unicode,你也可以用“汉字转Unicode”,不需要更改编码顺序了。
Unicode编码简介
Unicode是一种计算机字符编码。也称“统一码”“万国码”。
Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode中0×3000到0x9FFF的部分 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字”经”的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制 就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制, 2的16次方等于65536,所以UCS-2最多能编码65536个字符。 编码从0到127的字符与ASCII编码的字符一样,比如字母”a”的Unicode 编码是0×0061,十进制是97,而”a”的ASCII编码是0×61,十进制也是97,对于汉字的编码,事实上Unicode对汉字支持不怎么好,这也是没办法的, 简体和繁体总共有六七万个汉字,而UCS-2最多能表示65536个,才六万 多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4规范,就是用 4个字节来编码字符.
GB2312编码简介
GB2312 也就是信息交换用汉字编码字符集。GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。
信息交换用汉字编码字符集和汉字输入编码之间的关系是,根据不同的汉字输入方法,通过必要的设备向计算机输入汉字的编码,计算机接收之后,先转换成信息交换用汉字编码字符,这时计算机就可以识别并进行处理;汉字输出是先把机内码转成汉字编码,再发送到输出设备。
- PC官方版
- 安卓官方手机版
- IOS官方手机版