IBM ViaVoice 4。0中文连续语音识别软件试用记 IBM公司最近推出的中文语音识别系统IBM ViaVoice 4。0,是其推出的继美国英语、 英国英语、法语、德语、西班牙语、意大利语、日语之 后的第八种语言的语音识别产品。 ViaVoice 4。0系统带有一个3000 0常用汉语词条的基本词汇表,用户能增扩词汇表到6 5000条。该系统能将用户通过话筒输入的中文连续 语音识别成文字并输入到计算机中。识别文字的同时, 还可以识别标点符号和简单的排版命令,语音识别的结 果可以保存为Word 6。0的格式,也可以保存成 为标准的TXT文本格式。该系统初步实现了由人口述 文本计算机自动打字,是一种动口不动手形式的汉字输 入新软件。 笔者近日多次使用了该软件,切身体会到一种新文 字输入方法所带来的耳目一新的兴奋感觉。我使用的计 算机配置如下:Pentium200 MMX的CP U、32MB SDRAM内存、2。1GB硬盘、1 6位声卡、头戴式耳机联体话筒、中文Windows 95操作系统。在正确完成话筒设置、运行口音254 句适应训练后,系统自动进行了约30分钟的自我适应 训练并将结果存入硬盘。我找了一篇《电脑报》上的文 章,按系统要求以中等速率即每分钟180字的速度读 了起来,读完一段约300字停下一看,不禁惊喜万分 ,屏幕上整整齐齐地显示着刚才读过的文章,不到2分 钟输入300个汉字,只有4个错字!输入速度和识别 率如此之高,远远超出我事前的估计。难怪IBM公司 称之为“目前最准确的中文语音识别产品”。 通过多次使用该软件,我摸索出几点窍门: 1。由于软件是中文连续语音识别系统,所以输入 时应注意语音的连续性和稳定速率。另外,软件对中英 文混合语音识别困难,英文中只能识别如“DOS”、 “WINDOWS”等少数单词。 2。软件对专业名词、常用名词识别率特别高。如 :中华人民共和国、共产党、计算机、电脑、社会主义 市场经济、北京、上海、赵忠祥、倪萍等。对普通人名 识别率特低,需要用“纠错”功能修改并存入词汇表中 ,才能保证以后不出错。这也难怪,国人的名字千奇百 怪、五花八门,中文的同音字又特别多,词汇表确实难 以包罗万象。 3。对于数字,如“1024”,应读“1”、“ 0”、“2”、“4”,不能读作“一千零二十四”。 4。语音排版命令有“另起一行”、“另起一段” 、“空格”等几个,基本能满足正常需要。 5。软件要求的输入语音是比较规范的普通话,地 方口音较重的普通话识别率比较低。 6。软件具有智能学习功能,随着用户的不断使用 和随时“纠错”,系统对你的语音愈加熟悉,其识别率 也就更上一层楼。 综上所述,IBM ViaVoice 4。0虽 然还有一些不足之处,但从其使用的效果来看,在当前 的条件下,它确实不失为一种优秀的中文连续语音识别 软件。 |