IBM ViaVoice 4。0中文连续语音识别软件试用记


  IBM公司最近推出的中文语音识别系统IBM 
ViaVoice 4。0,是其推出的继美国英语、
英国英语、法语、德语、西班牙语、意大利语、日语之
后的第八种语言的语音识别产品。
  ViaVoice 4。0系统带有一个3000
0常用汉语词条的基本词汇表,用户能增扩词汇表到6
5000条。该系统能将用户通过话筒输入的中文连续
语音识别成文字并输入到计算机中。识别文字的同时,
还可以识别标点符号和简单的排版命令,语音识别的结
果可以保存为Word 6。0的格式,也可以保存成
为标准的TXT文本格式。该系统初步实现了由人口述
文本计算机自动打字,是一种动口不动手形式的汉字输
入新软件。
  笔者近日多次使用了该软件,切身体会到一种新文
字输入方法所带来的耳目一新的兴奋感觉。我使用的计
算机配置如下:Pentium200 MMX的CP
U、32MB SDRAM内存、2。1GB硬盘、1
6位声卡、头戴式耳机联体话筒、中文Windows
95操作系统。在正确完成话筒设置、运行口音254
句适应训练后,系统自动进行了约30分钟的自我适应
训练并将结果存入硬盘。我找了一篇《电脑报》上的文
章,按系统要求以中等速率即每分钟180字的速度读
了起来,读完一段约300字停下一看,不禁惊喜万分
,屏幕上整整齐齐地显示着刚才读过的文章,不到2分
钟输入300个汉字,只有4个错字!输入速度和识别
率如此之高,远远超出我事前的估计。难怪IBM公司
称之为“目前最准确的中文语音识别产品”。
  通过多次使用该软件,我摸索出几点窍门:
  1。由于软件是中文连续语音识别系统,所以输入
时应注意语音的连续性和稳定速率。另外,软件对中英
文混合语音识别困难,英文中只能识别如“DOS”、
“WINDOWS”等少数单词。
  2。软件对专业名词、常用名词识别率特别高。如
:中华人民共和国、共产党、计算机、电脑、社会主义
市场经济、北京、上海、赵忠祥、倪萍等。对普通人名
识别率特低,需要用“纠错”功能修改并存入词汇表中
,才能保证以后不出错。这也难怪,国人的名字千奇百
怪、五花八门,中文的同音字又特别多,词汇表确实难
以包罗万象。
  3。对于数字,如“1024”,应读“1”、“
0”、“2”、“4”,不能读作“一千零二十四”。
  4。语音排版命令有“另起一行”、“另起一段”
、“空格”等几个,基本能满足正常需要。
  5。软件要求的输入语音是比较规范的普通话,地
方口音较重的普通话识别率比较低。
  6。软件具有智能学习功能,随着用户的不断使用
和随时“纠错”,系统对你的语音愈加熟悉,其识别率
也就更上一层楼。
  综上所述,IBM ViaVoice 4。0虽
然还有一些不足之处,但从其使用的效果来看,在当前
的条件下,它确实不失为一种优秀的中文连续语音识别
软件。
Next-->page>>回上一页,看更多资料