五行日文输入法
================================================================================================
日文简述
日语是世界第六大语言。关于日语的起源有多种理论。有学者认为,从句法上说,日语接近诸如土耳其语和蒙古语之类的阿尔泰语言。日语在句法上与朝鲜语相似也得到广泛认可的。同时也有证据表明,日语词法和词汇在史前
受到南面的马来-波利西亚语言的影响。
日本古代,并没有自己的文字。由于日本是中国的近邻,因此其文化与文字都受到了我们中国的熏陶。在我国隋唐时期,汉字开始大量传入日本,日本人开始借用汉字来记载他们自己的语言。最初,他们只是借用汉字的音和形,去记录日本语。由于汉字结构复杂,笔划繁多,使用起来很不方便,于是日本人就把一些借用的汉字进行简化,后来就慢慢逐渐演变而形成了现在日文中的“假名”。
日文的假名分平假名和片假名两种。平假名是借用汉字的草书形成的,片假名则是借用汉字的偏旁冠盖形成的。一般书写时,多用平假名,而书写外来语或表记周围的地名、人名等时,多用片假名。在日文中,
并非全部使用假名,而且保留了很多直接沿用其音、形、义的汉字。日本人能在长期的积累中,创造出汉字与假名共用的文化,是一种伟大的创举,日文的发明为日本人后来的经济繁荣发展起了巨大的作用。
日文基础
与汉语和英语不同,日语没有复合元音而只有单元音。在日文中公有五个元音,它们分别是:あ、い、う、え、お,这五个元音发音近似汉语拼音中的a、i、u、e、o
。它们既可以独立构成音节,也可以与其他辅音共同构成音节。假名中,除あ、い、う、え、お五个元音外,其它假名均可以视为由辅音或半元音与假名中的五个元音相拼而成。
假名根据其发音,又可分为清音、拨音、浊音、半浊音。 一般学习日文都是从学习日文中的五十音图开始的。五十音图是将日语中的清音部分按其发音规律排成十行,每行五个假名,最未排一个拨音“ん”。传统的五十音图排列不很直观,并且只含清音部分和拨音,不含浊音与半浊音。
日语的音节有短音节与长音节这分,清音、浊音以及半浊音假名属于短音。当假名的发音时间延长约一倍时,就成了长音。长音的书写是在“あ”段假名后加“あ”;“い”段假名后加“い”;“う”段假名后加“う”;
“え”段假名后一般加“い”,有时也加“う”;“お”段假名后一般加“う”,有时也加“お”。使用片假名书写外来语时,长音使用长音符号“ー”。
五行日文的原理
日本人不仅使用假名与汉字,同时他们又使用罗马字来拼写假名,习惯上称为罗马拼音。五行日文就是根据日文假名与罗马拼音的对应关系,把与每个假名一一对应的罗马拼音定义为五行日文的假名编码。在日文中,假名的罗马拼音有三种表记法,这就造成同一个假名可能会有多种罗马拼音形式,在不同的语句中也可能会有不同的读音。为了使本输入法有一个统一规范的准则,五行日文输入法采用的表记法依据1954年12月9日日本内阁告示规定的罗马拼音形式,每一个假名都有一个对应的罗马拼音。
五行日文输入法与五行系列输入法中的其它输入法有所不同,它没有键盘布局,直接使用国际通用的26个英文字母按照罗马拼音拼写出日文假名。为了能使用户形象直观地学习五行日文输入法,我们绘制了日文假名与罗马拼音对照图。用户在使用过程中,也可象使用其它输入法一样,单击工具条上的字根键盘图 按钮,日文假名与罗马拼音对照图就可显示在桌面上。
日文假名与罗马拼音对照图
下面,我们结合日文假名与罗马拼音对照图,详细介绍一下日文假名所蕴含的规律。
本输入法的日文假名与罗马拼音对照图,并没有沿用日文传统五十音图排放,而是将日文假名按あ、い、う、え、お五个元音排列为五行。从上图中我们可以很清楚的看到,日文中的假名,除あ、い、う、え、お五个元音外,其他假名都是由辅音或半元音与假名中的五个元音相拼而成。
上图中的每一个方格都包含一组日文假名与其对应的罗马拼音,其中其上部分标识为日文假名名称(左边为平假名,右边为片假名),下部标识为与假名相对应的罗马拼音名称。在使用过程中,只需按照假名的罗马拼音输入编码,即可得到相应的日文假名。假名中的拨音ん未在上图中列出,它的编码定义为“n”。
在上图中,第一条橙色竖线左边的假名属于假名中的清音部分,它其实就是日文中的五十音图,只是排列形式不同而已,为了使排列直观,上图使用了三个同音同字的假名(い、う、え)。清音分别是由“k、s、t、n、h、m、y、r、w”与元音“a、i、u、e、o”组合而成。值得注意的是,由于清音假名中的“お”与“を”发音相同,为了区分它们,我们将
“を”编码改为“wo”。
第一橙色竖线与第二条橙色竖线间的假名为日文假名中的浊音部分。它们分别的是由辅音“g、z、d、b”与元音“a、i、u、e、o”组合而成。位于图中最后一列五个假名为日文假名中的半浊音。它们分别由辅音“p”与“a、i、u、e、o”组合而成。日文假名与罗马拼音对照图相比日本定义的五十音图,具有更全面、更直观和更实用等优点。
☆★☆虽然人们有时也用“shi”拼写假名“し”,用“chi”和“tsu”拼写假名“ち”和“つ”,用“fu”拼写假名“ふ”等。
但考虑到编码规则的规范性,我们并没有对“し、ち、つ、ふ”这四个假名依据它的多种罗马拼音实行多种编码,“し、ち、つ、ふ”这四个假名只有一种编码,分别为“si、ci、tu、hu”,等,而不采用“shi、chi、tsu、fu”等编码形式。
假名小写编码及长音符号
与英文一样,日文假名也有大小写之分。值得一提的是,不是所有的假名都有小写假名,小写假名主要的作用是用来与其它假名组合成促音、拗音或拼写外来语。小写假名与其相对应的大写假名读音相同,编码也相同。在书写时,一般写得比大写假名小且偏右小方。
除日文假名外,日文中在使用片假名书写外来语时,还经常用到长音符号“ー”。长音符号本身不发音,它一般加在片假名后,表示前一个音节拉长一倍。为了便于输入长音符号,我们将长音符号的编码定义为“J”。
日文词组的输入
依照汉字词组的定义,我们把日文中,任意连续书写的几个文字定义为日文中的词组。在输入日文词组,我们使用了两种样式,一为五笔词组输入样式,二为拼音简拼样式。
一、五笔词组输入样式。所谓五笔词组输入样式,就是按照五笔词组输入规则构建构词规则。即:
①.两字词组取每一个字的前两码
②.三字词组取第一、第二个字的前两码加第三个字的第一、二码;
③.四个及四个以上的词组,取第一、二、三以及最后一个字的第一码。
为了使所有日文词组都满足词组输入条件,我们把“あ、い、う、え、お”五个元音、以及拨音ん、长音符号“ー”都增添了第二种编码,第二种编码是在第一种编码的后面补加一个N。输入日文词组时,“あ、い、う、え、お”五个元音、以及拨音ん、长音符号“ー”都使用第二种编码。
这种方式的特点是,无论词组长度如何,其编码总为4码,任何日文词库可以随时导入,即时就能被系统转化利用。其缺点是,日文是表音字,词组都很长,不直观。且容易造成重码多。
二、拼音简拼式输入。这种方式是逐字输入日文词组中的第一码加最后一个字的第二码。这种方式有点象拼音整句输入,随着输入字数的增多,其重码就逐渐减少。
|