极点五笔里面输出设置的大五码是什麽意思啊 极点五笔里面输出设置的大五码是什麽意思啊
杆子五笔中设置的大五码是什么意思?以下文字资料由边肖为大家整理出版。让我们快速看看他们!
大五码,又称大五码或大五码,是盛行于台湾和香港的一种传统汉字编码方案。
地区标准号是CNS11643,也叫BIG-5码。
一、五大介绍
大五码是传统汉语界最常用的计算机汉字集标准,包含13060个汉字,其中两个字符为重码,Big5属于汉语内码。
虽然Big5在台湾、香港、澳门等中国传统地区流行,但长期以来都不是地方国家标准,而是行业标准。
各大系统的字符集,比如永恒中文系统,Windows,都是基于Big5的,只是厂商分别增删,衍生出很多不同的版本。
2003年,Big5被列入台湾官方标准附录,获得了更正式的地位。
这个最新版本叫Big5-2003。
VimIM在vim环境下,可以直接键入十进制或十六进制的Big5代码。
不需要启动输入法或者码表。
二、造字功能和结构
Big5码是一组双字节字符集,采用双八码存储方式,用两个字节来
大五
插一句话。
第一个字节称为“高字节”,第二个字节称为“低字节”。
0x81-0xFE用于“高字节”,0x40-0x7E和0xA1-0xFE用于“低字节”。
在Big5的分区中:
0x8140-0xA0FE是为用户定义的字符保留的
0xA140-0xA3BF
标点符号、希腊文字母和特殊符号,包括0xA259-0xA261,都放置了双音节计量单位的单词:“”。
0x3c 0-0x3fe
保留。
该区域不允许创建单词。
0xA440-0xC67E常用汉字按笔画排序,再按偏旁部首排序。
值得注意的是,Big5中反复出现了两个一模一样的字:由“武、武”设计的中文内码,所以被称为Big5中文内码。虽然五个软件包都没有成功,但是Big5代码对中国计算机内码的影响直到今天都是深远的。
“五大”的英文名“Big5”后来按英文词序译回中文,于是现在有了两个中文名字:“五大”和“五大”。
四、存在的问题
1.各厂商和政府推出的Big5扩展互不兼容,导致代码乱码。
2.特殊字符碰撞的问题
因为较低的元字符包括编程语言、外壳和脚本
字符串或命令中常用的特殊字符,如0x5c " "、0x7c "| "等。
“”用作转义符,在字符串中也称为转义字符,有多种用途,例如
n,r,t, ",等等。
而“|”在UNIX操作系统中多用作命令管道,如“ls -la
更“等等。
如果字符串中有这些特殊的转义字符,它们将被程序或文字翻译器解释为特殊目的。
但是因为是中文,不能正确解释为上述行为,所以程序可能会忽略这个转义符号或者中断执行。
如果出现这种情况,就违背了用户将其作为汉字一部分使用的初衷。
这种情况存在于“公”等常用词中。
但额外的麻烦是,有些输出函数并没有把“”当作特殊字符,所以往往有些程序或网页会错误地在“徐工改”一词后面加上“”。
3.私人造词。
在永恒中文系统,后来的Windows
在3.1、95和98中,定义了四个私人造词区:
0xFA40-0xFEFE
0x8E40-0xA0FE
0x8140-0x8DFE
0xC6A1-0xC8FE
私有造词区的初衷是让用户添加原本从码表中缺失的字符。但是,当每个用户在不同的地方添加不同的字符时,很难知道某个代码在交换数据时想要表达什么单词。
4.Big5代码不包括在内,因为很多日常用字都被视为异体字。
常用的名字如汉字,“玄”、“白”、“着”等。)被社会广泛使用,但不包括在Big5中。
在中国港澳台地区的互联网上,不难看到人们把尤、王建煊、的名字写成“尤希芳”、“王煊”、“陶吉吉”,一些国外的动画也可以看到繁体中文字幕中“穆”等字样。
“存”和“着”在香港很常用,但都包含在big5码内。
来源
百度百科:://baike . Baidu/subversion/133766/133766。
文章评论