友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
3K电子书 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

数字生命-第章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!




方治强赞赏地说:“说得对,只要你能做到。这并不容易。但只要你能将语用和语义的层面形成程序,语音方面的问题就是小问题了,什么语音流变什么的根本不用太当回事。”

9.最容易破解的难题

方治强知道,自己提出的这个方法是一个相对而言正确的方法。在语音识别方面,纯粹基于语音与结构语法的识别方式或许比较适用于英语法语德语之类的语言,因为那些语种的语法结构一直都是比较完善的,有一个经过数百年反复研究的语言研究成果为基础,比较容易进行语音识别方面的数字化。而中文则不是,中文的体系太复杂了文言文与现代汉语之间的断裂远远比英语中古英语与现代英语的区别来得剧烈。而日常使用中,哪怕是再现代的人,也会不自觉地使用一些古文中的字词句乃至语法,中学生在学古文的过程中最头痛的倒置,在日常使用中比比皆是,要怎么样才能建立一个相对完整的语法结构,才能匹配起语音识别后的处理呢?而从语义和语用出发,以智能程序为核心,以常识判断为依托,应该可以解决汉语的机器识别的问题。但是,这同样是一个几乎不可能完成的任务。语义和语用,并不是可以简单地体系化的内容,而是一个有固有规律可循,却千变万化的系统。全中国不知道有多少研究语义与语用的语言学家,那么多年来似乎也没什么大成果,那么,吕振羽是不是能做出自己的成果来?虽说,随着大学体制的变更,那些语言学家里大多数都是糊弄着写论文混资历的人,但基础知识却还是很扎实的,而吕振羽在这方面可以说是一无所知,仅仅凭着基本市面上容易找到的语言学教程,无论如何是不够的。

方治强说:“小吕,你给我个地址,回头我给你送一些资料过去。”

“嗯,那就谢谢伯父了。”

又聊了一会,吕振羽就急着告辞了。方治强的方法对于其他人来说或许是个大难题,而对于现在已经有了小羽的吕振羽来说,算不上什么大问题。小羽的智能,已经完全能理解比较复杂的语言环境了,语义和语用的判断对于小羽来说不是什么大问题,而挂在网上连续泡魔兽的经历,则让小羽学到了很多现代汉语中比较特别的表达方式,尤其是在年轻人中间比较流行的一些语言。按照方治强的说法,吕振羽要做的就是将语音系统直接和小羽现在的平台挂接上,现有的语音识别系统虽然不完善,但大致的框架是不错的,而小羽的自主判断和学习,将很快提升整个语音系统的识别能力。ωΧɡ。㏄

“小羽,我把这个语音识别软件的前端分拆了,语音输入以后,自动输出和读音相对的汉字的数据,但是不再自动选择,选择什么字,怎么组合字词句,怎么标点,这些都由你来完成。”

“明白。”将原理解释给小羽听了之后,小羽自主运算了将近4个小时后,同意了吕振羽的方案。而小羽也按照吕振羽的提议,将语音识别可能用到的模块分离出来,将自己积累了很久的常识方面的积累剥离,只保留了基本的交流环境,而将专业知识模块分割了开来。于是,这一次试运行的语音系统,虽然仍然是小羽自己在主导,但已经有了一个普通的语音识别系统的基本构架。对小羽来说,这没有什么意义,但是对于吕振羽来说,只要证明了这样一个基本构架是可行的,那么基于这样一个基本构架的程序模块,就可以逐渐实现,只有最核心的智能判别系统,可能会用到小羽的部分功能。

“试听,第一次:一,二,三。”挂接之后,小羽提示开始试听。

“试听,第一次结果:一,二,三。”小羽的界面对话框里,打出了正确结果,虽然这未免太简单了。

“试听,第二次:秋天来了,天气凉了,一群大雁往南飞。”

“试听,第二次结果:秋天来了,天气凉了,一群大雁往南飞。”结果仍然正确,吕振羽振奋了一些。

“试听,第三次:慈悲不是出于勉强,它是像甘霖一样从天上降下尘世;它不但给幸福于受施的人,也同样给幸福于施与的人;它有超乎一切的无上威力,比皇冠更足以显出一个帝王的高贵:御杖不过象征着俗世的威权,使人民对于君上的尊严凛然生畏;慈悲的力量却高出于权力之上,它深藏在帝王的内心,是一种属于上帝的德性,执法的人倘能把慈悲调剂着公道,人间的权力就和上帝的神力没有差别。所以,犹太人,虽然你所要求的是公道,可是请你想一想,要是真的按照公道执行起赏罚来,谁也没有死后得救的希望;我们既然祈祷着上帝的慈悲,就应该按照祈祷的指点,自己做一些慈悲的事。我说了这一番话,为的是希望你能够从你的法律的立场上作几分让步;可是如果你坚持着原来的要求,那么威尼斯的法庭是执法无私的,只好把那商人宣判定罪了。”(引用自《威尼斯商人》)

这一次小羽运算了半天后,显示了结果,虽然字词判断都没错,但标点符号却错了很多。不过,这已经比吕振羽预想的结果好很多了。经过大半天,整整400轮测试和磨合,小羽已经能将吕振羽的话听得八九不离十,乃至于一些比较晦涩的表达方式和字词,都难不住它。毕竟小羽现在的知识面之宽广,要远远超过一般的人类了。虽然目前吕振羽使用的是一个价格相当不便宜的耳麦,取音的指向性相当好,而且还带有噪音滤出功能,还没有进行有噪音的环境下的辨识测试,但仅仅目前的成果,可以说已经超越现有的语音辨识系统水平良多。

但是,同样的,小制约小羽充分发挥能力的瓶颈也开始不断出现了。首先,是实时判断的小羽目前要屈就于非实时判断的语音录入系统。现在的语音录入系统因为在判别方面的低效率,要经过一段繁复的计算和处理,而作为处理对象的语音数据,在处理的时候都是驻留在内存里的,一句两句简短的话还好,稍微长篇大论一点,内存的占用就比较吓人了,而且这些语音数据还是高质量的无损格式。虽然吕振羽的机器在家用的设备里堪称豪华,但用于这种专业应用就稍微有点力不从心了,毕竟吕振羽从来也没在小羽的优化计算方面下过功夫,而且好像目前对机器的压力也并不是小羽这一块产生的。加内存?升级cpu?或许都是办法吧,不过目前,吕振羽知道,再要升级,他可真的没钱了。而另一个瓶颈则是因为小羽最核心的部分,无论是病毒还是搜索机,都不是为了windows环境写的程序,严格的说,是都还没有来得及为了windows系统优化算法。但平时,贪图界面的舒服,吕振羽却一直在windows下进行日常工作的,这当中要经过一个模拟的环境,肯定也要消耗一部分电脑的计算资源。不过这个问题现在还不迫切。吕振羽的想法是,等到完善了小羽的语音输入输出之后,就该专门为小羽搭建一个独立的系统环境出来了。

稍后,吕振羽还把ttl类型的程序找了个出来挂接上去,小羽也就能开口说话了。比较基础的从文字到语音并不难,就是字库和音节库的对应而已,但是,字词之间的停顿,语气的变化,重读与轻读,还有语音流变的一些特征却无法表达出来,小羽已经掌握了基础的特征,但程序的语音库里没有能使用的素材,这个就没有办法了。

由于现在的成果相当不错,吕振羽随即决定了之后一段时间的两个工作方向,首先,要逐步完善语音系统,在最短时间内实现这个系统的产品化,第二个,就是开始对小羽的现有架构进行整理和分类优化。

让小羽进行优化,很大程度上是吕振羽现在已经意识到,小羽现在已经不能算是一个程序了,严格的讲,小羽所具有的能力,已经超过了一些科幻电影里对于智能电脑的估计,达到了一种相当高级的智慧。吕振羽甚至一直都没有把小羽当作程序,而更多地是当作一个助手,和一个朋友,在这种情况下,吕振羽隐隐觉得小羽应该有更好的一个环境,一个属于它自己的环境。让小羽继续住在windows这种高危险性的环境里显然不是吕振羽愿意看到的。

不过,好像无论怎么样,都要花钱。而现在,好像最缺少的就是这个。

10.展示

忙了大半个月后,吕振羽终于凑出了一小笔钱,给电脑升级了硬盘和内存。现在吕振羽的机器上两块硬盘,加起来已经有500g的容量了,3根1g的内存,已经是他用的这块主板的上限。为了处理音频方面的东西,他甚至还买了块最好的声卡。

能凑出这笔钱,还多亏了那个搜索机软件。吕振羽本来只是将这个软件作为比较不可靠的收入来源的,没想到却不经意之间成了最赚钱的东西。这个搜索机,最开始的时候没有什么人注意,名字很土,界面也很简单,还没有详细的说明文档。但是,网络上有时间的人真是多阿,共享软件平台的一个版主无聊之余,下了一遍这个搜索机,仔细地测试了功能后,发现这个软件的功能之强劲,远远超过现在任何搜索引擎推出的桌面程序,而且,附带的筛选,智能学习,和搜索结果索引生成器这些功能,更是有很大的开发潜力。这个名叫宝刀屠龙的版主写了篇叫《论文专家——搜索机》的文章,推荐了一把这个软件。宝刀屠龙发现了搜索机的潜质之一——用于写论文。强大的搜索和索引,让写论文变得轻松简单了,只要自己有了观点,将相关数据和材料按照自己的观点往上套就可以。这个功能的开发并不是吕振羽的本意,但实际上大大刺激了搜索机的下载量和付费量,几天之内,搜索机被下载了50万多次,而付费开始使用完全权限版本的,也有4000多人,毕竟一个月5块钱的月费,对于一般人来说,算不上什么,用搜索机这个软件省去的时间,可是大把大把的。除了大学里各种要写论文的人,另一个用户群是企业内的白领,尤其是市场营销和策划方面的人,本来他们的时间就主要是花在资料收集上的,然后,分类汇总,再结合自己公司的情况写各种报告和策划,搜索机可以大大减轻他们的工作强度,有些公司,甚至是公司出钱,给整个部门人手一个搜索机配备下去。仅仅这部分用户,又是好几千人。短短十几天里,吕振羽就从一个穷得没办法的人变成了个万元户,而且存款还在持续增加中。已经有搜索引擎的公司发邮件给吕振羽,要求收购这个软件,还有一些海外用户,积极建议吕振羽推出其他语种的版本。可是,现在吕振羽似乎没有时间花在这个上面。文心阁论坛

手头有了多余的钱之后,吕振羽否决了原先租借录音棚来制作音频片断的计划,而是自己买了一套入门级的专业器材,从录音到混音一应俱全,还买了整套的隔音设备和材料,用了整整一个月的时间,在自己租的这一室一厅里隔出了一个小小的录音棚。奇…书…网一直到吕振羽以自己的声音制作了第一套音频样本,开始从程序阶段实现语音引擎的时候,已经是12月初了。吕振羽的银行存款已经从2个月前的2000不到,变成了现在已经有将近20万,小小的搜索机现在每个月都能给他带来10多万的收入了。不过,从表面上看,没有人意识到吕振羽居然勉强也能算是个有钱人,他忙得没有时间给自己买衣服,也
返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!