要在计算机种处理汉字,就必须要解决汉字输入、输出和处理问题,下面一一解答:
一、汉字的输入问题
汉字的输入一般有三种方式:
数字编码拼音编码字形编码这三种编码方式各有各的好处,首先是数字编码,数字编码常用的时国标区位码,用数字串代表一个汉字输入,他的优点是不会重码,而且输入码和内部编码的转换比较方便,缺点是难以记忆;平拼音编码是以汉语拼音为基础的输入方法,他的优点是,如果是汉语母语者熟练掌握汉语拼音,不需要训练和记忆,马上就可以使用,但是缺点是汉语博大精深,同音字太多了,当你在拼音输入后还需要选择同音字选项来规避重码率,影响输入速度;字形编码,是使用汉字的形状 来进行编码,汉字总数虽多,但是有一笔一划组成,全部汉字的部件和笔画是有限,因此把汉字的笔画不见用字母或者数字进行编码,按笔画的顺序输入就能表示一个汉字,但是对于这种方式来说,上手难度还是有的。
二、汉字的输出问题
汉字的输出采用的是汉字字模码,字模码是用点阵表示的汉字字形代码。根据汉字输出的要求不同,点阵的多少也不同,有16*16点阵、24*24点阵、32*32点阵,甚至更高。字模点阵用来构成汉字库,字库中存储了每个汉字的点阵代码,当显示输出或打印输出时才检索字库,输出字模点阵,得到字形。
三、汉字的处理问题
汉字的处理采用的是汉字内码。汉字内码是汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为“0”。为了与英文字符能相互区别,汉字机内代码中两个字节的最高位均规定为“1”。有些系统中字节的最高位用于奇偶校验位,这种情况下用三个字节表示汉字内码。