首页 | 官方网站   微博 | 高级检索  
     

嵌入式中等词汇量英语语音识别片上系统
引用本文:王国梁,梁维谦,刘加,刘润生.嵌入式中等词汇量英语语音识别片上系统[J].清华大学学报(自然科学版),2005,45(10):1393-1396.
作者姓名:王国梁  梁维谦  刘加  刘润生
作者单位:清华大学,电子工程系,北京,100084
基金项目:国家自然科学基金资助项目(60272016)
摘    要:针对目前嵌入式英语语音识别系统中识别性能较差或硬件资源占用较大的问题,提出了一个在16 b定点数据信号处理语音芯片上实现的非特定人、中等词汇量英语命令字识别系统。该系统采用基于连续隐含M arkov模型(con tinuous dens ity h idden M arkov m ode l,CDHMM)的两级识别网络,通过应用改进的音素体系、B ayes ian信息准则模型参数选择算法、决策树和数据驱动相结合的状态聚类方法、最小互信息改变准则特征选择算法,在保证识别率的前提下,大大降低了模型的存贮空间和计算复杂度。实验表明,对1 235词的英语短句的识别率为96.41%,识别时间为0.46倍实时。

关 键 词:语音识别  嵌入式  状态共享  模型复杂度选择
文章编号:1000-0054(2005)10-1393-04
修稿时间:2004年10月12

Moderate vocabulary english speech recognition system embedded on a chip
WANG Guoliang,LIANG Weiqian,LIU Jia,LIU Runsheng.Moderate vocabulary english speech recognition system embedded on a chip[J].Journal of Tsinghua University(Science and Technology),2005,45(10):1393-1396.
Authors:WANG Guoliang  LIANG Weiqian  LIU Jia  LIU Runsheng
Abstract:Current embedded English speech recognition systems have poor performance or high hardware resource requirements.This paper presents an embedded English command speech recognition system using the continuous density hidden Markov model and a two-pass search strategy based on a 16-bit fixed-point digital signal processing(DSP.The parameter selection algorithm and decision tree are incorporated into the phone model with data driven tying,to maximize the recognition speed and minimize the memory footprint while maintaining the recognition accuracy.Also,the phone unit set is optimized using the minimum mutual information change(MMIC algorithm.Tests on a(1 235 two-word phrases data set show that the system provides a recognition accuracy rate of(96.41% while using only 46% of real time.
Keywords:speech recognition  embedded system  state tying  model parameter selection  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号