奉天安瑶网

两位40后权门学子先后研发五笔以及智能ABC输入法,修正多少代中国人输入习气

2024-11-02 16:23:41 来源:

源头 :DeepTech深科技

对于大少数西方人来说,两位在手机上装置第三方键盘彷佛残缺不需要 。后权但在中国,门学这是先后修正习气常态。

由于汉语的笔及誊写方式可能与发音残缺分说(日语、韩语以及越南语都有汉字的输输入变体) ,假如零星默认键盘不对于汉语妨碍特殊的入法优化 ,它就会颇为难用 。多少代中因此,国人中国当初有约莫 8 亿人运用了第三方智能键盘 ,两位它们可能预料用户想要输入的后权内容。

但对于第三方键盘的门学依赖也带来了清静危害 :大少数键盘运用都市将按键点击传输到云端,以实现更好的先后修正习气词组以及内容预料 ,假如运用挨次不运用饶富强盛的笔及加密协议 ,就会为内容拦阻侵略缔造机缘。输输入

明天 ,我想带巨匠踏上一段对于键盘运用挨次或者输入法编纂器(IMEs ,input method editors)历史的极客之旅。如今,输入法是如斯的普遍,致使于人们很简略淡忘它们降生的眼前藏着多少多自动 。

它们黑白常典型的立异案例,弥合了数字天下以及事实天下之间的边界 。

在 20 世纪 80 年月,市面上的总体电脑无奈处置汉字。纵然难题地实现为了汉字数字化  ,使其可能表当初电脑屏幕上 ,但依然面临一个大下场 :用户若何键入这些字符?特意是,你若何将数不胜数的汉字与 QWERTY 键盘上的 26 个字母相立室 ?

第一次的试验与明天的键盘运用挨次残缺差距,由于它自动的倾向主要会集在汉字的誊写方式上。

1983 年 8 月 ,也便是 40 年前,一位名叫王永夷易近的中国工程师开拓了第一种盛行的汉字输入法 ,名为五笔。他将一个汉字分解成差距的笔画,在 QWERTY 键盘上 ,每一个字母都对于应了多少个笔画 。

好比 ,汉字“犬”,对于应了多少种形态(笔画) :犬(字根) 、 一 、丿 、以及丶 。这些形态分说与键盘上的 D 、G、T 以及 Y 相立室 。因此 ,当用户键入“DGTY”时 ,五笔输入法就会将其与对于应的字符立室,并打出“犬”字。

在 QWERTY 键盘上运用五笔输入法 ,至多惟独要四个键(码),就能打出一个汉字  。这被以为是打汉字最快的方式之一。但缺陷也很清晰 :用户需要背下来哪些键对于应哪些笔画,因此学习曲线至关峻峭 。

汉字输入法睁开的下一步是缔造了拼音打字。这听起来可能难以信托 ,但拼音这种用尺度拉丁字母拼写每一其中文单词的今世方式,直到 20 世纪 50 年月才泛起 。在随后的 80 以及 90 年月 ,中国才开始试验在学校里先教孩子们拼音,而后再教他们若何写字 。

服从是 ,在所有将汉字与拉丁字母相立室的措施中 ,拼音成为了一种更易、更被普遍接受的措施。

咱们仍以“犬”字为例 。它的发音被尺度化为 quǎn ,以是在尺度键盘上键入 Q  、U 、A 、N 四个字母,屏幕上就会泛起这个字 。

(源头:AI 天生)(源头:AI 天生)

大批基于拼音的输入法是在 20 世纪 90 年月缔造的 。最突出的是北京大学合计机迷信教授朱守涛于 1993 年缔造的智能 ABC 。在微软将智能 ABC 整合进 Windows PC,并将其设为默认输入法之一后 ,它成为了中鼎祚用最广的输入法(王永夷易近以及朱守涛分说来自河南以及山东的村落子 ,但他们却引领了多少代人的输入法习气,其中,王永夷易近于 1943 年降生于河南省南阳市南召县鸭河工区的贫田舍庭 ,朱守涛于 1946 年降生于山东省宁阳县伏山镇东代村落) 。

可是,用拼音打字也有下场:多少十个或者多少百个汉字可能有相同的拼音拼写。假如你输入 QUAN,合计机无奈分说在 81 个汉字中 ,哪一个才是你想要的 。

因此,每一次用户在智能 ABC 中键入一串拼音时,依然需要从一长串候选字中抉择精确的那个。

侥幸的是 ,它们总因此相同的挨次展现,这象征着你可能记住你每一每一运用的字符出如今候选小窗口中的位置。

我运用智能 ABC 的亲自履历便是这样 。我名字中的最后一个字是毅,拼写为 yi  。yi 恰正是汉语拼音中可立室数目至多的发音,有数百个字符有着相同的拼写(谢谢啊  ,我的爸爸妈妈)  。当我打字的时候,刻在我的脑海里的一件事是:毅,是智能 ABC 的第四页的第六个选项。

这样打字的功能显明不高。事实上,用智能 ABC 打字比用五笔要慢。但下一代键盘挨次很快就逾越了前一代。

2006 年,搜狗输入法宣告 ,它本性上散漫了拼音打字的根基以及搜查引擎的技术 。正如搜查引擎可能推选最挨近用户查问的内容同样 ,键盘软件可能预料用户可能想要键入的内容。

有了搜狗,候选字符以及单词再也不按牢靠挨次展现,而是会凭证用户的键入历史记实以及往事内容妨碍交流 。好比 ,在这篇文章中,我已经打了多少回“毅”字 ,搜狗记住了这一点 ,于是每一当我输入 yi 时 ,它都市把“毅”放在首位。

良多其余立异的输入法与搜狗约莫在统一光阴缔造 。一些人试图将基于形态的措施与基于拼写的措施相散漫。自从触控板以及触摸屏开始运用以来 ,搭载了这种屏幕的配置装备部署应承用户直接在配置装备部署上写汉字 。

但随着光阴的推移 ,这些措施逐渐变患上小众 ,最受招待的仍是搜狗等智能键盘带来的更高效的打字措施,这也成为了中国人若何与技术以及相互互动的根基。

对于汉语与科技之间的历史关连,尚有良多更幽默的故事  。好比 ,中国港台地域睁开出了特有的一套汉字打字方式。我推选耶鲁大学东亚语言以及文学教授石静远(Jing Tsu)的《汉字王国》一书 ,很适宜相关知识未多少的人浏览 。

备注:文章问题比照原文有修正 。

作者简介:Zeyi Yang为《麻省理工科技品评》报道中国以及东亚的技术 。此前  ,他的作品曾经出如今《Protocol》  、《Rest of World》、《哥伦比亚往事品评》 、《南华早报》 、《日经亚洲》等媒体上 。

反对于 :Ren