<div id="ix56d"></div>

    <progress id="ix56d"><tr id="ix56d"></tr></progress>

    <div id="ix56d"></div>

    <div id="ix56d"><tr id="ix56d"></tr></div>

    <em id="ix56d"><ins id="ix56d"><mark id="ix56d"></mark></ins></em>

      <dl id="ix56d"></dl>

          <div id="ix56d"><ol id="ix56d"></ol></div>
          关闭

          关闭

          关闭

          封号提示

          内容

          首页 特定人孤立词语音识别的研究毕业论文

          特定人孤立词语音识别的研究毕业论文.doc

          特定人孤立词语音识别的研究毕业论文

          简介:本文档为《特定人孤立词语音识别的研究毕业论文doc》,可适用于小学教育领域

          ?#31350;?#23398;生毕业论文(设计)题目(中文):特定人孤立词语音识别的研究(英文):ResearchOfSpeakerdependentIsolatedwordSpeechrecognition姓名学号院(系)专业、年级指导教师毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重?#20449;担?#25152;?#24335;?#30340;毕业设计(论文)是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知除文中特别加?#21592;?#27880;和致谢的地方外不包含其他人或组织已经发表或公布过的研究成果也不包含我为获得及其它教育机构的学?#25442;?#23398;历而使用过的材料。对本研究提供过帮助和做出过?#27605;?#30340;个人或集体均已在文中作了明确的说明并表示了谢意。作者签名:     日 期:     ????????????指导教师签名:     日  期:     使用授权说明本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定即:按照学校要求提交毕业设计(论文)的印刷本和电?#24433;?#26412;学校有权保存毕业设计(论文)的印刷本和电?#24433;?#24182;提供目录检索与阅览服务学校可以采用影印、缩印、数字化或其它复制手段保存论文在不以赢利为目的前提下学校可以公布论文的部分或全部内容。作者签名:     日 期:     ????????????湖南科技学院?#31350;?#27605;业论文(设计)?#38386;?#22768;明本人郑重声明:所?#24335;?#30340;?#31350;?#27605;业论文(设计)是本人在指导老师的指导下独立进行研究工作所取得的成果成果不存在知识产权争议除文中已经注明引用的内容外本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要?#27605;?#30340;个人和集体均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。?#31350;?#27605;业论文(设计)作者签名:二○○八年月日毕业论文(设计)任务书课题名称:特定人孤立词语音识别的研究学生姓名:系别:物理与电子工程系专业:电?#26377;?#24687;工程指导教师:湖南科技学院?#31350;?#27605;业论文(设计)任务书、主题词、关键词:语音识别、孤立词、特定人、DTW、毕业论文(设计)内容要求:对语音识别的概念、分类、发展过程及发展趋势要有所介绍设计一个基于特定人的语音识别系统给出实现方案。对特定人语音识别系统中牵涉到的有关识别算法要进行编程并在MATLAB环境下进行仿真调试给出具体仿真结果。、文献查阅指引:赵力.语音信号处理.第一版?#26412;?#26426;械工业出版社陈立万.基于语音识别系统中DTW算法改进技术研究.微计算机信息()何强何英.MATLAB扩?#36129;?#31243;.第一版?#26412;?#28165;华大学出版社李潇王大堃.基于MATLAB的孤立字语音识别试验?#25945;ǎ?#22235;川理工学院学报(自然科学版)()、毕业论文(设计)进度安排:.?#30053;?#35770;文资料收集和整理完成开题报告。.?#30053;?#26597;找资料给出系统实现方案对算法进行编程和调试并完成毕业论文初稿。.?#30053;?#23436;成毕业论文修改并定稿。.年月准?#22797;?#36777;。教研室意见:负责人签名:注:本任务书一式三份由指导教师填写经教研?#30097;?#25209;后一份下达给学生一份交指导教师一份留系里存档。湖南科技学院?#31350;?#27605;业论文(设计)开题报告书论文(设计)题目特定人孤立词语音识别的研究作者姓名周?#36134;?#23646;系、专业、年级物理与电子工程?#26723;繾有?#24687;工程专?#30340;?#32423;指导教师姓名、职称杨熙预计字数开题日期选题的根据:)说明本选题的理论、实际意义)综述国内外有关本选题的研究动态和自己的见解一个完整特定人孤立词语音识别系统通常包括语音的输入、语音的预处理(预加重、加窗分帧、端点检测等)、特征提取、?#30423;?#19982;识别等几个?#26041;凇?#35821;音识别的过程可以被看作模式匹配的过程。本文介绍的DTW是采用一种最优化的算法mdashmdash动态规整法通过将待识别语音信号的时间轴进行不均匀地扭曲和弯曲使其特征与模板特征对齐并在两者之间不?#31995;?#36827;行两个矢量距离最小的匹配路径计算从而获得两个矢?#31185;?#37197;时累积距离最小的规整函数。这是一个将时间规整和距离测度有机结合在一起的非线性规整技术保证了待识别特征与模板特征之间最大的声学相似特性和最小的时差失真。DTW解决了发音长短不一的模板匹配问题是语音识别中出现较早较为经典的一种算法。语音识别研究从二十世纪年代开始到现在已经历半个多世纪的蓬勃发展在这期间获得了巨大的进展。但语音识别ASR(AutomaticSpeechRecognition)系统的实用化研究仍是近十年语音识别研究的一个主要方向。语音识别系统包含的知识面非常广对其进行研究对自己各方面知识的应用能力会有很大的提高。并且语音识别作为一门正火?#30830;?#23637;的技术其发展前景相当可观对其进行深入了解研究是非常必要的。主要内容:()语音识别的概念、分类、发展过程及发展趋势()语音识别系统的实现方案与语音识别中需要的语音信号处理理论()传统DTW算法?#26696;?#36827;后的快速DTW算法的实现与比较()在Matlab环境下进行特定人语音识别的仿真。研究方法:()阅读文献进行理论分析()把整个识别过程分成几个子过程逐步分析()对整个系统程序的测试采用分模块调试然后进行整体调试完成期限和采取的主要措施?#21644;?#25104;期限:年月到年月主要措施:?#32454;?#36981;照《湖南科技学院毕业论文(设计)工作管理办法》的指示精神结?#32454;?#20154;的实际情况我完成这项设计所采取的主要措施有?#25945;酰?#19968;是密切联系。联系本组设计成员及毕业设计指导师寻求有关毕业设计信息确定设计课题方向与设计内容二是虚心学习。利用课余时间到图书馆和网络上查阅资料并虚?#21335;?#32769;师请教和同学进行学习交流保障毕业设计的顺利完成。主要参考资料:钟林刘加刘润生.多层前向感知机汉语孤立数码语音识别J.电路与系统学报()。何强何英.MATLAB扩?#36129;?#31243;M.第一版?#26412;?#28165;华大学出版社徐文盛戴蓓倩方绍武陆伟.特定人汉语数码语音抗噪识别方法J.电路与系统学报()陈立万.基于语音识别系统中DTW算法改进技术研究J?#27573;?#35745;算机信息》(嵌入式与SOC)()李潇王大堃.基于MATLAB的孤立字语音识别试验?#25945;↗.四川理工学院学报(自然科学版)()黄文?#36153;?#21191;熊桂林?#19978;?#26126;.系统仿真分析与设计mdashmdashMatlab语音工程应用M.长?#24120;?#22269;防科技大学出版社林波吕明.基于DTW改进算法的孤立词识别系统的仿真与分析J.信息技术年第期指导教师意见:指导教师签名:教研室意见:签名:年月日开题报告会纪要时间年月日地点第三教学楼与会人员姓名职务(职称)姓名职务(职称)姓名职务(职称)李春树副教授杨熙助教李艳?#20960;?#25945;授周玲助教廖朝阳讲师谭永宏讲师卢卯旺教授会议记录摘要:会议主持人:记录人: 年 月日指导小组意见负责人签名:年月日系部意见负责人签名:年月日注:此表由学生本人填写一式三份一份留系里存档指导老师和本人各保存一份湖南科技学院毕业论文(设计)中期检查表毕业论文(设计)题目特定人孤立词语音识别的研究学生姓名周刚学号系别物理与电子工程专业电?#26377;?#24687;工程指导教师杨熙检查日期指导教师检查情况记载及修改意见:已经完成的工作:、完成了语音的采集。、初步完成特定人语音识别系统中的端点检测、特征提取、传统DTW算法和改进型DTW算法的比较和编程。、进行资料的整理。、论文大部分内容已经完成。下一步的工作:、对整个系统在MATLAB下进行仿真测试。、同时继续论文的写作工作。、参考文献要按照学校的规范写要在正文出现的位置标出。、仔细修改摘要。、进一步优化程序提高识别速?#21462;?#31614;名:签名:注:此表用于指导教师在学生毕业论文(设计)初稿完成后对学生执行任务书情况进行中期检查时用由指导教师填写。湖南科技学院毕业设计(论文)指导过程记录表毕业论文(设计)题目特定人孤立词语音识别的研究学生姓名周刚学号专业班级电信指导教师杨熙职称助教系(教研室)电子科学与技术指导过程记录指导内容记录(一)建议毕业设计的选题方向并提供一些参考课题及如何查阅资料。学生签名:年月日指导教师签名:年月日指导内容记录(二)确定毕业设计题目给出毕业论文设计要求指导开题报告并推荐一些参考文献、书籍和网?#23613;?#23398;生签名:年月日指导教师签名:年月日指导内容记录(三)特定人语音识别系统所需的语音处理理论知识及核心算法DTW算法。学生签名:年月日指导教师签名:年月日指导内容记录(四)语音样本的采集样本语音库和测试语音库的建立。学生签名:年月日指导教师签名:年月日指导过程记录指导内容记录(五)对采集到的样本进行处理端点检测算法的选择和特征?#38382;?#30340;选择。学生签名:年月日指导教师签名:年月日指导内容记录(六)传?#25215;虳TW算法和快速DTW算法的编程实现。学生签名:年月日指导教师签名:年月日指导内容记录(七)在MATLAB下对程序进行编译和调试对DTW算法和快速DTW算法进行比较。学生签名:年月日指导教师签名:年月日指导内容记录(八)修改论文初稿摘要的修改章节的调节对仿真结果要分析图表的标注和引用的参考文献要规范。学生签名:年月日指导教师签名:年月日答辩小组组长意见组长(签名):年月日注:本表与毕业论文一起装订存档。湖南科技学院?#31350;?#27605;业论文(设计)评审表论文题目特定人孤立词语音识别的研究作者姓名周?#36134;?#23646;系、专业、年级物理与电子工程?#26723;繾有?#24687;工程专?#30340;?#32423;指导教师姓名、职称杨熙字数定稿日期中文摘要论文中首先介绍了孤立词语音识别系统的基本理论分析了孤立词语音识别的基本工作过程。?#24188;?#20171;绍了常用的孤立词语音识别算法:DTW(DynamicTimeWarping动态时间弯折)以?#26696;?#36827;的DTW对两种算法进行了比?#32454;?#25454;比较结果采用比较高效的改进型DTW以提高识别效率。提出了基于动态噪声的四状态端点检测算法给出了详细的算法流程?#23478;?#21450;具体?#38382;?#30340;设置。用MATLAB仿真了在有噪声和无噪声的情况下利用这些算法对孤立词的端点检测效果实验结果表明些算法具有抗噪声能力。关键词(个)语音识别孤立词特定人DTW英文摘要ThethesisfirstintroducestheelementarytheoryofisolatedwordspeechrecognitionsystemandanalysesthebasicworkprocessofisolatedwordspeechrecognitionThenitintroducestwokindsofisolatedwordspeechrecognitionalgorithmsincommonuse,DynamicTimeWarping(DTW)andadvancedDTW,carryingonthecomparisontothebothAccordingtothecomparisonresultsandconsideringthissystemrsquoscharacteristic,itadoptsadvancedDTWatpresenttoimproverecognitionrateInthispaper,itproposesafourstateendpointdetectionalgorithmbasedondynamicnoiseandgivesthedetailedalgorithmflowchartaswellastheconcreteparametersestablishmentItalsogivestheisolatedwordendpointdetectioneffectusingthealgorithminnoiseandnonnoisesituationwiththeMATLABsoftwaresimulationTheexperimentalresultsindicatethatthisalgorithmhastheantinoiseability关键词(个)speechrecognitionisolatedwordspeakerdependentDTW指导教师评定成绩评审基元评审要素评审内涵满分指导教师实评分选题质量目的明确符合要求选题符合专业培养目标体现学科、专业特点和教学计划的基本要求达到毕业论文(设计)综合?#30423;?#30340;目的。理论意义或实际价值符合本学科的理论发展有一定的学术意义对经济建设和社会发展的应用性研究中的某个理论或方法问题进行研究具有一定的实际价值。选题恰当题目规模?#23454;?#38590;易度适中有一定的科学性。能力水平查阅文献资料能力能独立查阅相关文献资料归纳总结本论文所涉及的有关研究状况及成果。综合运用知识能力能运用所学专业知识阐述问题能对查阅的资料进行整理和运用能对其科学论点进行论证。研究方案的设计能力整体思路清晰研究方案合理可?#23567;?#30740;究方法和手段的运用能力能运用本学科常规研究方法及相关研究手段(如计算机、实验仪器设备等)进行实验、实践并加工处理、总结信息。外文应用能力能阅读、翻译一定量的本专业外文资料、外文摘要和外文参考书目(特殊专业除外)体现一定的外语水?#20581;?#35770;文质量文题相符较好地完成论文选题的目的要求。写作水平论点鲜明论据充分条理清晰语言流畅。写作规范符合学术论文的基本要求。用语、格?#20581;?#22270;表、数据、量和单位、各种资料引用规范化、符合标准。论文篇幅字左右。实评总分成绩等级指导教师评审意见:指导教师签名:说明:评定成绩分为优秀、?#24049;謾?#20013;?#21462;⒓案瘛?#19981;?#26696;?#20116;个等级实评总分mdash分记为优秀mdash分记为?#24049;胢dash分记为中等mdash分记为?#26696;?#20998;以下记为不?#26696;瘛?#35780;阅教师评定成绩评审基元评审要素评审内涵满分评阅教师实评分选题质量目的明确符合要求选题符合专业培养目标体现学科、专业特点和教学计划的基本要求达到毕业论文(设计)综合?#30423;?#30340;目的。理论意义或实际价值符合本学科的理论发展有一定的学术意义对经济建设和社会发展的应用性研究中的某个理论或方法问题进行研究具有一定的实际价值。选题恰当题目规模?#23454;?#38590;易度适中有一定的科学性。能力水平查阅文献资料能力能独立查阅相关文献资料归纳总结本论文所涉及的有关研究状况及成果。综合运用知识能力能运用所学专业知识阐述问题能对查阅的资料进行整理和运用能对其科学论点进行论证。研究方案的设计能力整体思路清晰研究方案合理可?#23567;?#30740;究方法和手段的运用能力能运用本学科常规研究方法及相关研究手段(如计算机、实验仪器设备等)进行实验、实践并加工处理、总结信息。外文应用能力能阅读、翻译一定量的本专业外文资料、外文摘要和外文参考书目(特殊专业除外)体现一定的外语水?#20581;?#35770;文质量文题相符较好地完成论文选题的目的要求。写作水平论点鲜明论据充分条理清晰语言流畅。写作规范符合学术论文的基本要求。用语、格?#20581;?#22270;表、数据、量和单位、各种资料引用规范化、符合标准。论文篇幅字左右。实评总分成绩等级评阅教师评审意见:评阅教师签名:说明:评定成绩分为优秀、?#24049;謾?#20013;?#21462;⒓案瘛?#19981;?#26696;?#20116;个等级实评总分mdash分记为优秀mdash分记为?#24049;胢dash分记为中等mdash分记为?#26696;?#20998;以下记为不?#26696;瘛?#28246;南科技学院?#31350;?#27605;业论文(设计)答辩记录表论文题目特定人孤立词语音识别的研究作者姓名周?#36134;?#23646;系、专业、年级物理与电子工程?#26723;繾有?#24687;工程专?#30340;?#32423;指导教师姓名、职称杨熙答辩会纪要时间年月日地点第三教学楼答辩小组成员姓名职务(职称)姓名职务(职称)姓名职务(职称)李春树副教授杨熙助教李艳?#20960;?#25945;授周玲助教廖朝阳讲师谭永宏讲师卢卯旺教授答辩中提出的主要问题及回答的简要情况记录:、论文中改进的DTW算法较传统DTW算法有何优点?答:由论文中图可看出改进的DTW算法更进一步?#38469;?#20102;搜索范围从而减少了数据计算?#32771;?#24555;识别速度并提高了计算准确度在仿真结果中能清楚的看出其改进效果。、论文中用到的端点检测算法为?#25991;?#25239;噪声?答:论文中的端点检测算法设定了高低短时能量、高低过零率、最大静音时间、最小语音长度六个门限值其中短时能量是用于抗噪声设计的由于语音序列的前帧一般都为噪声而端点检测算法中的高低能量门限是以前帧的平均能量值作为参考依据这样我们的算法就是基于动态背景噪声的。一般要根据实际情况选取本系统取前帧平均能量值的倍和倍分别作为高低能量门限。、论文中只提到了对单个字的识别能否实现对多字词的识别?答:DTW能实现对多字词的识别但本文中的四端点检测法是针对单字词设计的不过根据本文中四端点检测法的方法进行扩?#36129;?#33021;轻?#36164;?#29616;对多字词的识别。会议主持人:记录人:年月日答辩小组意见评语:评定等级:负责人(签名):年月日系学位委?#34987;?#24847;见评语:论文(设计)最终评定等级:负责人(签名):系部(公章)年月日校学位委?#34987;?#24847;见评语:评定等级:负责人(签名):年月日目录绪论语音识别系统基本理论语音识别系统的组成预处理特征?#38382;?#30340;提取MFCC?#38382;?#35745;算流程差分倒谱?#38382;鼶ynamicTimeWarping算法DTW算法原理改进的DTW算法系统的软件设计与仿真语音预处理改进的端点检测算法及仿真改进的端点检测算法端点检测算法子程序流程?#32423;?#28857;检测仿真特征?#38382;?#25552;取子程序及仿真DTW算法仿真语音识别仿真结论参考文献附录A部分程序致谢插图索引?#23478;?#33324;语音识别系统框?#32426;?#29992;能量和过零?#24335;?#34892;端点检测图线性频率上fm和f关系图动态时间弯曲(DTW)算法求最小失真图DTW算法搜索路径?#35745;?#37197;路?#23545;际?#31034;意?#32426;?#23545;角线附近的带状区域?#32426;?#25918;宽端点后的区域限制图预加重后的语音效果图四状态转移的端点检测图ldquo停止rdquo的短时能量和过零率图基于四状态转移的端点检测流程?#32426;?#26080;噪声环境下的端点检测图有噪声环境下的端点检测图维特征?#38382;?#37096;分值图数字mdash在MATLAB环境下的识别结果显示附表索引表实验一在传统DTW算法下的失真测度表实验一在改进DTW算法下的失真测度表实验二在传统DTW算法下的失真测度表实验二在改进DTW算法下的失真测度表实验一传统DTW算法和改进DTW算法的用时比较表实验二传统DTW算法和改进DTW算法的用时比较特定人孤立词语音识别的研究摘要语音是人类进行交流的手?#25105;?#27492;使用语音作为人机?#25442;?#30340;途径对于使用者?#27492;凳亲?#33258;然的一种方式同时设备的小型化也要求省略键盘以节省体积。近年来语音识别技术被广泛应用于工业控制、消费类产品及移动通信中是高科?#21152;?#29992;领域的研究热点。本文就是在这种情况下对特定人孤立词语音识别系统做了一些?#25945;帧?#35770;文中首先介绍了孤立词语音识别系统的基本理论分析了孤立词语音识别的基本工作过程。?#24188;?#20171;绍了常用的孤立词语音识别算法:DTW(DynamicTimeWarping动态时间弯折)以?#26696;?#36827;的DTW对两种算法进行了比?#32454;?#25454;比较结果采用比较高效的改进型DTW以提高识别效率。提出了基于动态噪声的四状态端点检测算法给出了详细的算法流程?#23478;?#21450;具体?#38382;?#30340;设置。用MATLAB仿真了在有噪声和无噪声的情况下利用这些算法对孤立词的端点检测效果实验结果表明些算法具有抗噪声能力。【关键词】语音识别 孤立词 特定人 DTWResearchOfSpeakerdependentIsolatedwordSpeechRecognitionAbstractSpeechisthemeansthathumanbeingcarriesoncommunicationTherefore,usingspeechasahumancomputerinteractionapproachisthemostnaturalwayfortheuserAtthesametime,equipmentminiaturizationalsodemandsomittingthekeyboardtoeconomizevolumeInrecentyears,thespeechrecognitiontechnologyhasbeenwidelyappliedtoindustrialcontrol,consumingproductandmobilecommunicationItisahotresearchspotinhightechnologyapplicationfieldThisthesismakessomediscussionsonspeakerindependentisolatedwordspeechrecognitionsysteminthiscaseThethesisfirstintroducestheelementarytheoryofisolatedwordspeechrecognitionsystemandanalysesthebasicworkprocessofisolatedwordspeechrecognitionThenitintroducestwokindsofisolatedwordspeechrecognitionalgorithmsincommonuse,DynamicTimeWarping(DTW)andadvancedDTW,carryingonthecomparisontothebothAccordingtothecomparisonresultsandconsideringthissystemrsquoscharacteristic,itadoptsadvancedDTWatpresenttoimproverecognitionrateInthispaper,itproposesafourstateendpointdetectionalgorithmbasedondynamicnoiseandgivesthedetailedalgorithmflowchartaswellastheconcreteparametersestablishmentItalsogivestheisolatedwordendpointdetectioneffectusingthealgorithminnoiseandnonnoisesituationwiththeMATLABsoftwaresimulationTheexperimentalresultsindicatethatthisalgorithmhastheantinoiseability【Keywords】speechrecognition isolatedword speakerdependent DTW绪论语音识别(SpeechRecognition)是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域语音识别又是一门交叉学科它与声学、语音学、语言学、数?#20013;?#21495;处理理论、信息论、计算机科学、人工智能、数理统计等众多学科紧密相连。语音识别经过四十多年的发展已经显示出巨大的应用前景。随着计算机技术、模式识别和信号处理技术以及声学技术等的发展使得语音识别技术取得显著进步开?#21363;?#23454;验?#26131;?#21521;市场。近二三十年来语音识别技术在工业、?#19994;紜?#36890;信、汽?#26723;繾印?#21307;疗、家庭服务、消费电子产品等领域有着广泛应用。当今语音识别产品在人机?#25442;?#24212;用中已经占到了越来越大的比例。其主要应用在语音命令、应用于电信增值业务、数据库检索?#30830;?#38754;。语音识别系统从不同?#23884;取?#19981;同的应用范围等都会有不同的分类。一般语音识别系统按不同的角度有下面几种分类:.按说话人的?#19981;?#26041;式可以分为孤立词(IsolatedWord)识别连续语音(ContinuousSpeech)识别。孤立词识别?#20405;?#35828;话人?#30475;?#21482;说一个词或短语每个词或短语在词汇表中都算作一个孤立词条。因此可以用?#35789;?#29616;简单的家用电器控制。连续语音识别?#20405;?#23545;说话人以日常自然的方式发音通常特指用于语音录入的听写机。.?#35789;?#21035;对象的类型可以分为特定人(SpeakerDependent)语音识别和非特定人(SpeakerIndependent)语音识别。特定人?#20405;?#23450;只针对一个用户的语音识别比较简单能得到较高的识别?#23454;?#20351;用前必须由特定人的用户输入大量的发音数据对其进行?#30423;貳?#38750;特定人则可用于不同的用户这种识别系统的通用?#38498;?#24212;用面广但难度也较大不容易得到高的识别率它的实用化将会有很高的经济价值和深远的社会意义。.?#35789;?#21035;的词汇量可以分为小词汇、中词汇和大词汇量语音识别。一般来讲~个词汇属于小词汇量语音识别系?#22330;个词汇属于中词汇量语音识别系?#22330;?#22823;于个词汇属于大词汇量语音识别系?#22330;?#35821;音识别研究从二十世纪年代开始到现在已经历半个多世纪的蓬勃发展在这期间获得了巨大的进展。这里仅仅按照一些重要方法的出现和发展为线索进行简要回顾。年代ATTBell实验室实现了第一个可识别十个英文数字的语音识别系统mdashmdashAudry系?#22330;?#24180;代提出了动态规划(DP)和线性预测分析技术(LP)其中后者较好地解决了语音信号产生模型的问题对语音识别的发?#20849;?#29983;了深远影响。年代在模式识别思想、动态规划方法、线性预测思想等基础研究的成功应用的支撑下孤立词发音和孤立语句发音的识别成为了可行的有用技术。年代的最大特点是从基于模板的方法向统计模型方法的转变特别?#20146;?#21521;研究隐马尔?#36335;?#27169;型HMM的理论、方法和实现问题。年代语音识别研究的重点转向自然语言的识别处理任务转移到航空旅行信息的索取。同时语音识别技术不断应用于电话网络增强话务员服务和自动化。年以来人机语音?#25442;?#25104;为研究的焦点。研究重点包括即兴口语的识别和理解自然口语对话以及多语种的语音同声翻译。语音识别技术经过全球半个多世纪的研究目前已经发展到了接近实用的阶段。在实验?#19968;?#22659;下大词汇量的?#35782;?#24335;连续说话的宽带语音信号的平均识别率可?#28304;?#21040;以上。在这样的水平基础上语音识别技术开始尝试从实验?#24050;?#31034;系统走向实用化商品。但语音识别技术要进入成熟的商业运用还有一段艰难的路程还必须在很多方面取得?#40644;菩?#36827;展。主要包括高可靠性增加词汇量应用拓展?#26723;?#25104;本减小体积四个方面。语音识别ASR(AutomaticSpeechRecognition)系统的实用化研究是近十年语音识别研究的一个主要方向。近年来消费类电子产品对低成本、高稳健性的语音识别片上系统的需要快速增加语音识别系统大量地从实验室的PC?#25945;?#36716;移到嵌入式设备中。本文主要是针对普通控制命令词小词汇量的特定人孤立词语音识别的研究。全文共分3章具体的研究内容如下:第?#38381;攏?#20171;绍了语音识别系统的实现方案给出了孤立词识别中需要的语音信号处理理论如预加重、端点检测和特征?#38382;?#25552;取?#21462;?#31532;2章:介绍了基于动态规划(DP)思想的DTW算法并在此算法的基础上讨论了快速DTW算法的实现。最后给出了两者的对?#30830;?#30495;。第3章:针对本文采集的语音样本对预处理后的语音提出了基于动态噪声有四状态端点检测法。阐述了系统的软件设计过程对各部分给出了相应的软件流程图并且对具体算法进行了MATLAB仿真论证。语音识别系统基本理论语音识别系统的组成语音识别系统的典型实现方案如框图所示。?#23478;?#33324;语音识别系统框?#23478;?#20010;完整特定人孤立词语音识别系统通常包括语音的输入、语音的预处理(预加重、加窗分帧、端点检测等)、特征提取、?#30423;?#19982;识别等几个?#26041;?#22522;本构成如图所示。语音识别的过程可以被看作模式匹配的过程模式匹配?#20405;?#26681;据一定的准则使未知模式与模型库中的某一个模型获得最佳匹配的过程。模式匹配中需要用到的参考模板通过模板?#30423;?#33719;得。在?#30423;方?#27573;用户将词汇表中的每个词依次说一遍作为模板保存为模板库。在识别阶段语音信号经过相同的通道得到语音特征?#38382;?#29983;成测试模板并与参考模板进行匹配将匹配分数最高的参考模板作为识别结果。同时还可以在一些先验知识的帮助下提高识别的准确率。预处理由于语音信号的平均功?#21183;资?#22768;门激励和口鼻辐射影响高频端大约在Hz以上按dB倍频程跌落所以在语音信号频?#36164;?#39057;?#35797;?#39640;相应的成分越小高频部分的频?#22918;鵲推?#37096;分的难求为此要在预处理中进行预加重(Preemphasis)处理。预加重通过滤波提升高频分量并消除Hz或Hz的工频干扰使信号的频?#22918;?#24471;?#25945;?#20445;持在?#25512;档?#39640;频的整个频带中能用同样的信噪比求频谱?#21592;?#20110;频谱分析或声道?#38382;?#20998;析。通常用一阶FIR数?#33268;?#27874;器?#35789;?#29616;系统函数为:H(z)=ndashazndash(a接近于)()进行预加重数?#33268;?#27874;处理后接下来就要进行加窗分帧处理。分帧采用可移动的有限窗口进行加权的方法实现即用窗函数omega(n)来乘X(n)从而形成加窗语音信号Xomega(n)=X(n)*omega(n)。在语音信号处理中常用的窗函数是矩?#26410;?#21644;汉明窗。本文中kHz采样帧长为帧移为的汉明窗。端点检测的目的是?#24433;?#21547;语音的一般信号中确定出语音的起点以及终点,有效的端点检测不仅能使处理时间最小,而且能排除无声段的噪声干扰,从而使识别系统具有?#24049;?#30340;识别?#38405;?端点检测的成功与否甚至在某种程度上直接决定了整个语音识别系统的成败。在实?#35270;?#29992;中通常是利用过零?#19990;?#26816;测清音用短时能量来检测浊音两者配合实现可靠的端点检测。用得比较多的是经典的双门限端点检测算法。如图所示。图用能量和过零?#24335;?#34892;端点检测输入的语音信号X(l),加窗分帧处理后得到的第n帧的语音信号为Xn(m),则:Xn(m)=omega(m)X(nm)m=~(N)()其中n=TThellip并且N为帧长T为帧移。第n帧语音信号Xn(m)的短时能量En为:()这里定义短时能?#32771;?#30701;时幅值它的主要作用:①区分浊音和清音因为浊音的短时能量比清音大得多。②区分声母与韵母的边界无声和有声的分界连字的分界?#21462;"?#20316;为一种超音段信息用于语音识别中。一帧信号中波?#26410;?#36234;零电平的?#38382;?#31216;为过零率。定义Xn(m)的短时过零率Zn为:()上式中sgn是符号函数。考虑到开?#23478;院?#24635;会出现能量较大的浊音设一个较高的门限amp用以确定语音已开始再取一比amp稍低的门限amp用以确定语音的起始点N和结束点N由于语音起?#32423;?#24448;往存在着能量很弱的清辅音(如s、f等)只用能量去判断很难把它们和无声区分开但发现它们的过零率明显高于无声?#25105;?#27492;可以用过零?#19990;?#31934;确起点。第四将仔细介绍端点检测算法。特征?#38382;?#30340;提取特征?#38382;?#25552;取的目的是抽取语音特征以使在语音识别时类内距离尽量小类间距离尽量大。语音特征?#38382;?#25552;取是语音识别的关键问题特征?#38382;?#30340;?#27809;?#23545;于语音识别精度和识别时间有很大影响。常用的?#38382;?#26377;线性预测的倒谱系数(LPCC)和Mel频率的倒谱系数(MFCC)。全极点线性预测模型(LPC)是基于发音模型建立的并假设语音信号为自回归信号利用线性预测分析获得倒谱?#38382;?#22240;此LPCC系数也是基于合成的?#38382;?#27809;有充分利用人耳的听觉特性对辅音的描述能力较差抗噪声?#38405;?#36739;差。实际上人的听觉系?#21576;?#19968;个特殊的非线性系统它响应不同频?#24066;?#21495;的灵敏度是不同的基本上是一个对数的关系。由于充分模拟了人的听觉特性而且没有任何前提假设因此MFCC?#38382;?#20855;有很好的识别?#38405;?#21644;抗噪能力。研究表明Mel频率的倒谱?#38382;?#25152;含的信息量比其它?#38382;?#22810;能较好的表现语音信号并且比较充分利用人耳特殊感知特性?#38405;?#20248;于LPCC?#38382;?#22240;此本文中用到的Voicebox工具箱中的mfccm函数就是采用采用MFCC?#38382;FCC?#38382;?#35745;算流程MFCC?#38382;?#35745;算的要点是将线性功?#21183;譙(n)转换成为mel频率下的功?#21183;?#36825;需要在计算之前先在语音的频谱范围内设置若干个带通滤波器:Hm(n)m=hellipYndashn=hellipHndashY为滤波器个数H为一帧语音信号的点数。每个滤波器具有三?#20999;?#29305;性其中心频率为fm它们在Mel频?#25163;?#19978;是均匀分布的。在线性频率上当m?#38386;∈毕?#37051;的fm间隔很小随着m的增加相邻的fm间隔逐渐拉开。另外在频?#24335;系?#30340;区域fm和f之间有一?#38382;?#32447;性的。如图所示?#21644;?#32447;性频率上fm和f关系MFCC?#38382;?#30340;计算是以ldquobarkrdquo为频率基准的Mel频?#35270;?#32447;性频率的转换关系为:()其中线性频率f的单位是Hz。求MFCC?#38382;?#30340;过程为:()对输入语音帧作快速傅利叶变换FFT将时域信号转化为频域信号。计算FFT之前要把一帧数据(点)乘以一个hamming窗以克服Gibbs现象。()把功?#21183;?#36890;过带通滤波器然后再取自然对数。()计算其离散余弦变换。为每帧数据计算出L阶MFCC?#38382;?#21518;一般还要为这L个系数分别乘以不同的权系数实际上是一个短窗口:()差分倒谱?#38382;?#26631;准的MFCC?#38382;?#21453;映了语音?#38382;?#30340;静音特特性而人耳对语音的动态特征更为敏感所以通常是用差分倒谱?#38382;?#26469;描述语音特征的动态特性。差分?#38382;?#30340;计算公式为:()这里c和d都表示一帧语音信号?#38382;齦为常数一般取这时差分?#38382;?#23601;称为当前帧的前两帧和后两帧?#38382;?#30340;线性组合。由上式计算得到的差分?#38382;?#20026;一阶MFCC差分?#38382;?#29992;同样的公式对一阶差公?#38382;?#36827;行计算可以得到二阶差MFCC。在相同的?#38382;?#32500;数下Mel滤波器个数D对识别?#38405;?#24433;响不大这里取本文中是将阶MFCC?#38382;退?#19968;阶差分?#38382;?#21512;并为一个矢量(阶)作为一帧语音信号的?#38382;?#22240;为动态信息和静态信息形成互补所?#38405;?#24456;大程度上提高系统的识别?#38405;堋ynamicTimeWarping算法假定一个孤立词语音识别系统利用模板匹配法进行识别。这时一般是用单词作为识别单元。在?#30423;方?#27573;用户将词汇表中的每个词依次说一遍作为模板存入模板库在识别阶段将输入语音的特征矢量时间序列依次与模板库中的每个模板进行相似度比较将相似度最高的作为识别结果输出。但是语音具有相当大的随机性?#35789;?#26159;同一个人在不同的时刻所讲的同一句话、发同一个音也不可能具有完全相同的时间长?#21462;?#22240;此在进行模板匹配时把识别信号伸长或缩短至参考模板的长度是必不可少的但研究表明简单的线性拉伸或压缩并不能有效的提高识别率。对此日本学者板仓将DP算法的概念用于解决孤立词识别时的说?#20843;?#24230;不均匀的难题提出了著名的动态时间伸缩算法即DTW算法。DTW是采用一种最优化的算法mdashmdash动态规整法通过将待识别语音信号的时间轴进行不均匀地扭曲和弯曲使其特征与模板特征对齐并在两者之间不断的进行两个矢量距离最小的匹配路径计算从而获得两个矢?#31185;?#37197;时累积距离最小的规整函数。这是一个将时间规整和距离测度有机结合在一起的非线性规整技术保证了待识别特征与模板特征之间最大的声学相似特性和最小的时差失真。DTW解决了发音长短不一的模板匹配问题是语音识别中出现较早较为经典的一种算法。DTW算法原理在对每一帧语音信号提取MFCC特征?#38382;院?#23601;转化成了一组MFCC特征向量。语音识别就是要将测试语音的这个特征向量同模板库中已存在的语音特征向量进行模式匹配寻找距离最短的模式作为识别结果。在用DTW算法进行识别判决时,由于测试语音与参考模式语音长短不同因此需要通过DTW动态计算两个长度不同的模式之间的相似程?#28982;?#32773;叫做失真距离。图动态时间弯曲(DTW)算法求最小失真假设参考模板和测试模板分别用R和T表示它们之间的相似度用它们之间的距离DTR来度量距离越小相似度越高。为了计算这一失真距离要从T和R中各个对应帧之间的距离算起。设n和m分别是T和R中?#25105;?#19968;帧dT(n)R(m)表示这两帧特征矢量之间的距离在DTW中通常采用欧式距离。设测试模板T共有N帧参考模板R共有M帧将测试模板和参考模板的帧号分别在坐标系的横坐标和纵坐标上标出则各个帧号之间的关系可以形成一个网格网格中的任?#25105;?#20010;交叉点(nm)表示测试模板的T(n)和参考模板的R(m)相交并且该交叉点拥有帧失真为DT(n)R(m)。如上图所示。DP算法就是寻找一条通过?#36865;?#26684;中若干个格点的最佳路径。路径不是随意选择的首先任?#25105;?#31181;语音的发音快慢都有可能变化但是其各部分的先后次序不可能改变因此所选的路径必定是?#24188;?#19979;角出发在右上角结束。如下图所示?#21644;糄TW算法搜索路径假设路径通过的格点依次为(nm)hellip(nimi)hellip(nNmM)其中(nm)=()(nNmM)=(NM)。路径可以用函数mi=Phi(ni)来描述其中ni=ii=hellipNPhi()=Phi(N)=M。为了?#23396;?#24452;不至于过分倾斜?#38469;?#26012;?#35797;趡的范围内。如果路径已通过了格点(nimi)那么下一个通不定期的格点(nimi)只可能是(nimi)、(nimi)和(nimi)用gamma表示这种?#38469;?#26465;件。求最佳路径的问题即为:()其中为最佳路径函数。D(nimi)=dT(ni)R(mi)D(nimi)()其中的D(nimi)由下式决定D(nimi)=min{D(nimi)D(nimi)D(nimi)}()从(nimi)=()开?#32426;?#19979;搜索(nm)再搜索(nm)helliphellip对每一个(nimi)都存储相应的前一格点(nimi)及相应的帧匹配距离dnimi。搜索到(nNmM)时只保留一条最佳路径。由于DTW不?#31995;?#35745;算测试矢量与模板矢量的距离以寻?#26131;?#20248;的匹配路径所以得到的两矢?#31185;?#37197;是累计距离最小的路径函数这保证了它们之间存在最大的声学相似特性。改进的DTW算法通常规整函数被限制在一个平行四边形的网格内它的一条边斜率为另一条边斜率为。如图所示。?#35745;?#37197;路?#23545;际?#31034;意图规整函数的起点是()终点为(NM)DTW算法的目的是在此平行四边?#25991;?#30001;起点到终点寻找一个规整函数使其具有最小的代价函数保证了测试模板与参考模板之间具有最大的声学相似特性。由于在模板匹配过程中限定?#36865;?#25240;的斜?#23460;?#27492;平行四边形之外的格点对应的帧匹配距离是不需要计算的。另外因为每一列各格点上的匹配计算只用到了前一列的个网格所以没有必要保存所有的帧匹配距离矩阵和累积距离矩阵。充分利用这两个特点可以减少计算量和存储空间的需求形成一种高效的DTW算法。把实际的动态弯曲分为三段(Xa),(XaXb)和(XbN)其中:()由于Xa和Xb取最相近的整数从上式可出M和N的限制条件:()当不满足上式中的两个条件时可认为两者差太大无法进行动态弯折匹配。在X轴上的每一帧不再需要与Y轴上的每一帧进行比较而只是与Y轴上yminymax间的帧进行比较。yminymax的计算如下式所示Xa=Xb时:当Xa<Xb时比较分三段:当Xa>Xb时:沿X轴上每前进一帧虽然所要比较的Y轴上的帧数不同但弯曲特性是一样的这样路径的累积距离都为:D(x,y)=d(x,y)minD(x,y),D(x,y),D(x,y)()由于X轴上每前进一帧只需要用到前一列的积累距离所以只需两个矢量D和d分别保存前一列的累积距离和当前列的累积距离而不用保存整个矩阵。通过不断更新数据?#35789;?#29616;一直进行到待测模板的最后一帧矢量D的最后一个元素即为两个模板经过动态规划后的匹配距离这样可大大减小存储空间减小计算?#30475;?#32780;提高识别速?#21462;?#38500;上面介绍的整体路?#23545;际?#30340;DTW算法外还有两种简单?#38469;?#30340;DTW算法下面分别进行简单的介绍。、搜索宽度受限的DTW算法在实?#35270;?#29992;中DTW算法加入了一些搜索限制条件,实际的搜索范围是在一定的宽度之内,如图所示的对角线附近的带状区域。图对角线附近的带状区域图在这个范围之内按动态规划路径计算累积匹配距离可以进一步减少存储空间减少计算量提高识别速?#21462;!?#25918;宽端点限制的DTW算法对于普通DTW对端点检测比较敏感端点信息?#20146;?#20026;一组独立的?#38382;?#25552;供给识别算法它要求两个比较模式起点对起点终点对终点对端点检测的精度要求比较高?#34987;?#22659;噪声比较大或语音由摩擦音构成时端点检测不易进行放松端点限?#21697;?#27861;不?#32454;?#35201;求端点对齐克服了由于端点算法不精确造成的测试模式和参考模式起点终点不能对齐的问题一般情况下起点和终点在纵横两个方向只要放宽帧就可以也就是起点可以在()、()、()、()、()终点也可类?#21697;?#26494;放宽端点后的区域限制图在放松端点限制的动态时间规整算法中累积距离矩阵中的元素()、()、()、()、()不是根据局部判决函数计算得到的而?#20405;?#25509;将帧匹配距离矩阵的元素填入自动从其中选择最小的一个作为起点对于终点也是从?#27801;?#32456;点的?#24066;?#33539;围内选择一个最小值作为参考模式和未知模式的匹配距离。图放宽端点后的区域限制系统的软件设计与仿真这一章主要介绍系统的软件设计与仿真过程。软件设计主要?#21069;?#25324;语音预处理子程序、端点检测子程序以及语音识别子程序。由于语音识别系统牵涉的算法子程序比较多为了方便验证我们采用MATLAB进行了算法仿真。语音预处理预加重一般是语音信号数字化?#38498;?#22312;?#38382;?#20998;析之前在计算机里用具有dB倍频程的提升高频特性的预加重数?#33268;?#27874;器?#35789;?#29616;它一般是一阶的高通数?#33268;?#27874;器。H(Z)=ndashmuz()上式中mu?#21040;?#36817;于。本文中取mu=。根据上式进行预加重。图为男生命令词ldquo停止rdquo经过预加重滤波后的仿真结果。kHz采样。从图中可以看出预加重对信号处理的重要性高频部分的信号能量得到了加强。图预加重后的语音效果改进的端点检测算法及仿真改进的端点检测算法资料表明语音识别错误的原因一半来自端点检测。因此没有足够准确的语音起止点检测将会?#26723;?#35821;音识别的识别率特别是起点的检测。在实验?#19968;?#22659;下虽然信噪比比较大但是人们发音时的一些无意识的噪声如人的呼吸气流等都会造成误检。由于本文采用的都是一个字的孤立词因此采用基于动态噪声的四状态转移端点检测来消除这些影响。把整个端点检测过程总共分成个状态:status、status、status和status分别代表静音状态(含噪声)、起始过渡状态、语音状态和结束状态。各状态之间的转换关系如图所示。图四状态转移的端点检测为了提高端点检测的精确性消除呼吸气流等无意识噪声的影响本文在基于状态转移的端点检测基础上还做了一些改进。、采用多门限判定。设定六个门限?#25285;?#30701;时能量和过零率分别有两个门限一个高门限一个低门限最短语音时间门限?#20048;?#35823;检排除突发性的噪声最大静音门限确定语音是否结束。根据实际环境来设定具体门限值语音序列的前帧一般都为噪声所以这里高低能量门限以语音前帧的平均能量值作为参考依据这样我们的算法就是基于动态背景噪声的。一般要根据实际情况选取本系统取前帧平均能量值的倍和倍分别作为高低能量门限过零率门限取常值和最大静音门限一般为~帧最短语音时间门限一般为~帧一帧信号的短时能量按第二章介绍的方法计算假设为amp那么前帧输入信号的平均能量设为ampaver则按下式进行计算。()上式中的amp(i)为第i帧输入信号的短时能量。、如果输入信号中有Hz工频干扰或者AD变换点的工作点偏移时用第二章中定义的短时过零?#19990;?#21306;分无声和清音就不可靠。为此修正短时过零率?#38382;?#23450;义为一帧语音波?#26410;?#36234;某个非零电平T的?#38382;?#21363;下?#20581;?#26412;系统中的T为经验值取。()下图为命令词ldquo停止rdquo的短时能量和过零率仿真?#35745;?#20013;过零?#36866;前?#19978;式进行计算的。图ldquo停止rdquo的短时能量和过零?#35782;?#28857;检测算法子程序流程?#32426;?#22522;于四状态转移的端点检测流程图上图是基于动态噪声的四状态端点检测方法的子程序流程图。先根据前面的介绍设定六个门限?#31561;?#21518;对程序进行初始化设定初始状态status=count=silence=。在静音状态如果能量或过零?#39135;?#36234;了高门限就开始标记起始点进入语音状态。在过渡状态中由于?#38382;?#30340;数?#24403;冉闲?#19981;能确定是否处于真正的有效语音状态因此只要两个?#38382;?#30340;数值都回落低门限下就将当前状态?#25351;?#21040;静音状态。而如果在起始过渡状态中两个?#38382;?#21482;要有一个超过了高门限就可以确定进入有效语音状态。门窗的开关等引起的突发性噪声也可以引起短时能量或过零率的数值很高但是往往不能维持足够长的时间通过最短语音时间门限值来判断。当前状态处于有效语音状态时如果两个?#38382;?#30340;数值都?#26723;?#21040;低门限以下而?#26131;?#30340;记时长度小于最短时间门限则认为是一段噪音。流程图中的四个状态分别对应静音状态、起始过渡状态、语音状态和结束状态。计算过零率和短时能量之前要对读取的语音信号进行归?#25442;?#22788;理。过零率和短时能量分别按照第二章的方法计算。流程图中的X和X分别为单字词的起?#32423;?#28857;和结束端点。端点检测仿真图无噪声环境下的端点检测图有噪声环境下的端点检测图3为无噪声环境下用四状态检测方法对采样到的男声命令词ldquo停rdquo的端点检测结果。从图上可以看出能够准确检测到孤立词的语音端点。图4为有噪声环境下的端点检测。读取的语音是一男生发音的命令词ldquo播rdquo。从图上可以看出在语音前端位置有明显的噪声用基于动态噪声的四状态端点检测方法仍然可?#21592;?#36739;精确地检测到各个孤立字的起始

          用户评价(0)

          关闭

          新课改视野下建构高中语文教学实验成果报告(32KB)

          抱歉,积分不足下载失败,请?#38498;?#20877;试!

          提示

          试读已结束,如需要继续阅读或者下载,敬请购买!

          评分:

          /140

          ¥25.0

          立即购买

          立即扫码关注

          爱问共享资料微信公众号

          返回
          顶部

          举报
          资料

          澳门银座时时彩平台

            <div id="ix56d"></div>

            <progress id="ix56d"><tr id="ix56d"></tr></progress>

            <div id="ix56d"></div>

            <div id="ix56d"><tr id="ix56d"></tr></div>

            <em id="ix56d"><ins id="ix56d"><mark id="ix56d"></mark></ins></em>

              <dl id="ix56d"></dl>

                  <div id="ix56d"><ol id="ix56d"></ol></div>

                    <div id="ix56d"></div>

                    <progress id="ix56d"><tr id="ix56d"></tr></progress>

                    <div id="ix56d"></div>

                    <div id="ix56d"><tr id="ix56d"></tr></div>

                    <em id="ix56d"><ins id="ix56d"><mark id="ix56d"></mark></ins></em>

                      <dl id="ix56d"></dl>

                          <div id="ix56d"><ol id="ix56d"></ol></div>