博士学位论文答辩公告--航海学院黄公平

2019年05月16日 09:53  

学科专业:信息与通信工程
论文题目:面向语音通信与交互的麦克风阵列语音增强方法研究
答辩人:黄公平
指导老师:陈景东
时  间:2019-05-27  16:00
地  点:航海学院西配楼215
一、学位论文简介
在语音通信和语音交互等各种声学应用中,麦克风传感器所采集到的声信号总会受到到各种噪声的污染,从而影响话音质量和可懂度。语音增强致力于利用信号处理方法来抑制噪声,从而从带噪信号中恢复期望语音信号,该方面的研究起始于上世纪60 年代。在所提出的方法中,基于麦克风阵列的波束形成和多通道降噪是两类最常见的语音增强方法。语音及音频信号是典型的宽带信号(频率范围从20 Hz 到20 KHz), 为了在抑制噪声的过程中不引入大的信号畸变,通常希望波束形成或多通道降噪能够一方面大幅提升信噪比而另一方面在信号带宽内保持一致或近似一致的空间和对信号的频率响应。但现有方法仍远远无法满足这一要求,因此进一步深入的是势在必行。针对以上挑战,本论文工作分别从频不变波束形成和基于最小失真的多通道降噪两类方法入手,展开更为深入的研究。在第一个方面,研究了环形麦克风阵列频不变波束形成、同心圆环阵列频不变波束形成和鲁棒超指向波束形成等方法,提出了基于雅可比 级数展开的环形阵列频不变波束形成方法,其能从理论上保证设计波束近似等于理想波束,且其波束能导向到麦克风阵列所在平面的任意方位。本文还提出了具有灵活阵列结构的同心圆环阵列频不变波束形成方法,其不仅能改善低频白噪声放大问题,还能很好的解决高频零陷问题。同时,本文提出了基于Krylov 子空间的稳健超指向性波束形成方法,其能在白噪声增益和高指向性因子之间取得合理的折衷。在第二方面,研究了基于最小失真约束的最大信噪比滤波方法。不同于传统信号模型只考虑信号空间相关性,本文兼顾信号帧间相关性和空间相关性, 提出了一种在短时傅里叶变换域的基于信号最小失真约束的子带多通道最大信噪比滤波器,其比传统最最大信噪比滤波器有更好的语 音增强效果。本文的主要工作和创新点如下: 1 利用雅可比级数展开对波束形成中的指数项进行逼近,从理论上证明了这种逼近在最小均方误差准则下是最优的。然后基于雅可比级数展开提出了一类环形阵列频不变波束形成方法,相应的波束能导向到麦克风阵列所在平面的任意 方位。 2 基于环形阵列频不变波束形成,推导出了阵列波束图、指向性因子和白噪声益的解析表达式,以及它们与麦克风数目及阵列半径的数学关系;还进一步证明了环形差分阵列和圆环谐波分解波束形成都是环形阵列频不变波束形成方法的一种特例。 3 推导出了环形阵列频不变波束形成器的数学表达式,基此证明了环形阵列频不变波束形成中的零陷问题是由波束形成器系数分母中贝塞尔函数的零点引起 的。在此基础上提出了同心圆环阵列频不变波束形成方法,和单环阵列方法相 比,不仅导向能力好,而且还改善了鲁棒性、白噪声增益和零陷问题。 4 在分析同心圆环阵列频不变波束形成时,提出了根据圆环上麦克风传感器数目来进行雅可比级数展开的逼近方法,从理论上给出了设计N 阶频不变波束形成的必要条件。进一步从理论上分析了频不变波束形成在几种常用同心圆环阵列结构下的性能,给出了在圆环阵列中心增加一个麦克风传感器来改善零阶贝塞尔函数引入的零陷问题的理论依据。 5 提出了一种基于Krylov 子空间的稳健超指向性波束形成方法,通过合理构造子空间及代价函数,Krylov 超指向性波束形成器能在白噪声增益和高指向性因子之间取得合理的折衷。 6 兼顾信号帧间相关性和空间相关性, 提出了一种在短时傅里叶变换域的基于信号最小失真约束的子带多通道最大信噪比滤波器,不仅能提升信噪比,还能显著控制语音畸变。分析证明,期望信号协方差矩阵的秩越大,则最大信噪比滤波器造成的期望信号失真越严重。  
二、攻读博士学位期间以第一作者发表与学位论文相关的学术论文:
[1]  Huang, Gongping,Chen, Jingdong,Benesty, Jacob。A flexible high directivity beamformer with spherical microphone arrays。JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA,2018/143/5。JCR分区;PubMed;SCI(E);中科院分区,29857755;WOS:000433050700064  
[2]  Huang, Gongping,Benesty, Jacob,Chen, Jingdong。Superdirective Beamforming Based on the Krylov Matrix。IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING,2016/24/12。EI;JCR分区;中科院分区,20164803062326;WOS:000388199000026  
[3]  Huang, Gongping,Chen, Jingdong,Benesty, Jacob。Direction-of-arrival estimation of passive acoustic sources in   reverberant environments based on the Householder transformation。JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA,2015/138/5。EI;PubMed;SCI,20154901635053;26627779;WOS:000366319200046  
[4]  Huang, Gongping,Benesty, Jacob,Long, Tao,Chen, Jingdong。A Family of Maximum SNR Filters for Noise Reduction。IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING,2014/22/12。EI;SCI(E);中科院分区,20150500470591;WOS:000344459700010  
[5]  Huang, Gongping,Benesty, Jacob,Chen, Jingdong。On the Design of Frequency-Invariant Beampatterns with Uniform Circular Microphone Arrays。IEEE/ACM Transactions on Audio Speech and Language Processing,2017/25/5。EI;JCR分区;中科院分区,20171903637349;
[6]  Huang, Gongping,Chen, Jingdong,Benesty, Jacob。Insights Into Frequency-Invariant Beamforming With Concentric Circular   Microphone Arrays。IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING,2018/26/12。JCR分区;SCI(E);中科院分区,WOS:000446325200005  
[7]  Huang, Gongping,Chen, Jingdong,Benesty, Jacob。On the design of differential beamformers with arbitrary planar   microphone array geometry。JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA,2018/144/1。JCR分区;PubMed;SCI(E);中科院分区,30075665;WOS:000440810900011  
[8]  Huang, Gongping,Benesty, Jacob,Chen, Jingdong。Design of robust concentric circular differential microphone arrays。JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA,2017/141/5。EI;JCR分区;PubMed,20172203699761;28599519;WOS:000403270600039


关闭