Listing 1 - 1 of 1 |
Sort by
|
Choose an application
In dit doctoraatsproefschrift worden verscheidene open problemen in akoestische-echo-onderdrukking en akoestische-feedbackbeheersing behandeld. De algemene doelstelling bestaat in het ontwikkelen van oplossingen die een hoge performantie en geluidskwaliteit leveren en die een robuust gedrag vertonen in een realistische omgeving. De voorgestelde aanpak steunt op een solide theoretische basis door de toepassing van resultaten uit de systeemidentificatie en parameterschatting, in tegenstelling tot de ad-hocaanpak die gevolgd wordt in bestaande oplossingen. De voorgestelde oplossingen werden ontwikkeld met permanente aandacht voor de vereiste rekenkracht, zodat die maximaal 50 % hoger ligt dan de nodige rekenkracht voor de bestaande oplossingen. In het kader van akoestische-echo-onderdrukking worden de problemen van dubbelspraakrobuustheid, ondermodellering van het akoestische-echopad en onvoldoende excitatie behandeld. De aanpak van de twee eerste problemen is gebaseerd op het gebruik van adaptieve decorrelerende prefilters die de spectrale kleuring in het bronsignaal en in de residuele echocomponent ten gevolge van ondermodellering moeten reduceren. Die decorrelerende filters kunnen gelijktijdig worden geïdentificeerd met het akoestische-echopad door gebruik te maken van de predictiefoutmethode (PEM) voor systeemidentificatie. Het resultaat is een verbetering van de misaanpassing met 30-40 dB (in het geval van dubbelspraak) en een verlaging van de variantie met 20-35 dB (in het geval van ondermodellering), ten koste van een toename in de rekencomplexiteit met 50 % in vergelijking met het genormaliseerde kleinste-gemiddelde-kwadratenalgoritme (NLMS). Het probleem van onvoldoende excitatie wordt benaderd vanuit een Bayesiaans minimale-gemiddelde-kwadratische-fout-perspectief (MMSE). Die aanpak leidt tot het gebruik van een regularisatiematrix die verschilt van de traditionele gescaleerde eenheidsmatrix, waarin eventuele a-priorikennis over het akoestiche-echopad kan worden opgenomen. Bovendien wordt aangetoond dat de bestaande proportionele-adaptatie-algoritmen geïnterpreteerd kunnen worden als een speciaal geval van de voorgestelde regularisatie-aanpak. Een verbetering van de misaanpassing tot 10 dB blijkt mogelijk te zijn met een geregulariseerd NLMS-gebaseerd algoritme dat slechts 25 % meer rekenkracht vraagt dan het originele NLMS-algoritme. Het akoestische-feedbackprobleem wordt in dit proefschrift op twee manieren benaderd, meer bepaald op basis van inkepingsfiltergebaseerde fluittoononderdrukking (NHS) en adaptieve feedbackonderdrukking (AFC). In het kader van NHS wordt een nieuwe parametrische frequentieschattingsmethode ontwikkeld die gekenmerkt wordt door een rekencomplexiteit die lineair toeneemt met de lengte van het gebruikte databestand. Daarnaast wordt een nieuwe ontwerpprocedure voor bikwadratische parametrische-egalisatiefilters voorgesteld die gebaseerd is op de techniek van pool- en nulplaatsing. In het kader van AFC wordt de PEM-gebaseerde AFC-aanpak die eerder werd ontwikkeld voor gebruik in hoorapparaten uitgebreid naar kamerakoestische en audiotoepassingen. De PEM-gebaseerde aanpak steunt op de identificatie van een bronsignaalmodel dat kan worden gebruikt bij het ontwerp van decorrelerende prefilters. Het doel van die prefilters bestaat erin het geslotenlussignaalcorrelatieprobleem eigen aan AFC op te lossen om een foutloos akoestische-feedbackpadmodel te kunnen bekomen. Het blijkt mogelijk om op die manier de misaanpassing te verbeteren met 7 dB in vergelijking met het PEM-gebaseerde AFC-algoritme voor hoorapparaten en met 12 dB vergeleken met het NLMS-algoritme, en dit ten koste van een verhoging van de rekencomplexiteit met 25-50 % t.o.v. NLMS. Uit een vergelijkende evaluatie met de state-of-the-artmethodes voor akoestische-feedbackbeheersing blijkt de PEM-gebaseerde AFC-aanpak zowel de bestaande fasemodulatiegebaseerde feedbackbeheersingsmethodes (PFC) en NHS-methodes, als de AFC-methodes die een decorrelatie in de gesloten signaallus uitvoeren, te overtreffen in termen van de haalbare maximale stabiele versterking en geluidskwaliteit, en dit voor spraak- én muzieksignalen. This thesis deals with several open problems in acoustic echo cancellation and acoustic feedback control. Our main goal has been to develop solutions that provide a high performance and sound quality, and behave in a robust way in realistic conditions. This can be achieved by departing from the traditional ad-hoc methods, and instead deriving theoretically well-founded solutions, based on results from parameter estimation and system identification. In the development of these solutions, the computational efficiency has permanently been taken into account as a design constraint, in that the complexity increase compared to the state-of-the-art solutions should not exceed 50 % of the original complexity. In the context of acoustic echo cancellation, we have investigated the problems of double-talk robustness, acoustic echo path undermodeling, and poor excitation. The two former problems have been tackled by including adaptive decorrelation filters in the adaptive filtering algorithm, with the aim of whitening the near-end signal component and the residual echo component resulting from undermodeling. These decorrelation filters can be identified concurrently with the acoustic echo path by using the prediction error method (PEM) for system identification. As a result, a 30-40 dB misadjustment improvement (in the double-talk case) and a 20-35 dB variance decrease (in the undermodeling case) have been obtained, at the cost of a complexity increase of 50 % compared to the normalized least mean squares (NLMS) algorithm. The poor excitation problem has been approached from a Bayesian minimum mean square error (MMSE) point of view. This approach has led to the use of a regularization matrix different from the traditional scaled identity matrix, which may incorporate prior knowledge on the acoustic echo path. It has moreover been shown that the existing proportionate adaptation algorithms can be viewed as a special case of the proposed approach to regularization. A misadjustment improvement up to 10 dB has been obtained with a regularized NLMS-type algorithm that requires only 25 % more computations than the original NLMS algorithm. Two approaches to acoustic feedback control have been considered in this thesis, namely notch-filter-based howling suppression (NHS) and adaptive feedback cancellation (AFC). In the context of NHS, we have developed a novel parametric frequency estimation method, which is characterized by a computational complexity that is linear in the data record length. Also, a new design procedure for biquadratic parametric equalizer filters is proposed, based on a technique known as pole-zero placement. In the context of AFC, the PEM-based AFC approach that was proposed earlier for hearing aid AFC has been generalized to room acoustic and audio applications. The PEM-based approach relies on the identification of a near-end signal model that can be used in the design of decorrelating prefilters. These prefilters are aimed at resolving the AFC closed-loop signal correlation problem and hence providing an unbiased acoustic feedback path model. We have obtained a misadjustment improvement of 7 dB compared to the hearing aid PEM-based AFC algorithm and of 12 dB compared to the NLMS algorithm, at the cost of a 25-50 % complexity increase compared to NLMS. In a comparative evaluation with the state-of-the-art acoustic feedback control methods, the PEM-based AFC approach was shown to outperform the existing phase-modulating feedback control (PFC) and NHS methods, as well as the AFC methods that apply a decorrelation in the closed signal loop, in terms of the achievable maximum stable gain and sound quality, both for speech and audio signals. De kwaliteit van spraak- en muzieksignalen wordt vaak aangetast door de akoestiek van de ruimte waarin die signalen worden opgenomen of weergegeven. Dit doctoraatsproefschrift handelt over twee dergelijke akoestische problemen en over de manier waarop die problemen kunnen worden aangepakt met behulp van digitale signaalverwerkingstechnieken. Het akoestische-echoprobleem doet zich voor wanneer een geluidssignaal na weergave door een luidspreker wordt opgevangen door een microfoon die eigenlijk dient om een lokaal spraaksignaal op te nemen. Dat probleem doet zich voornamelijk voor in handenvrije spraaktoepassingen aangezien de akoestische terugkoppeling van de luidspreker naar de microfoon in dergelijke systemen veel groter is dan in traditionele telefoontoestellen. Het akoestische-feedbackprobleem ontstaat door een gelijkaardige akoestische terugkoppeling, maar in dit geval is het luidsprekersignaal afkomstig van de betreffende microfoon wat leidt tot een gesloten signaallus. Bij een te hoge versterking tussen de microfoon en de luidspreker kan dat geslotenlussysteem onstabiel worden, met onaangename fluittonen tot gevolg. Akoestische feedback wordt regelmatig waargenomen in publieke omroepsystemen en geluidsversterkingssystemen in concertzalen. De oplossingen die in dit proefschrift worden aangedragen steunen op een solide theoretische basis door de toepassing van resultaten uit de systeemidentificatie en parameterschatting, in tegenstelling tot de bestaande oplossingen die eerder een ad-hocaanpak nastreven. Het resultaat is een verzameling van signaalverwerkingsalgoritmen die op een betrouwbare manier feedback- en echo-onderdrukking uitvoeren aan een hoge geluidskwaliteit en met een beperkte rekenkracht. The quality of speech and music signals is often degraded by the acoustics of the environment in which these signals are being captured or played back. In this thesis, two such acoustic problems are addressed and it is shown how digital signal processing techniques can be applied to solve these problems. The acoustic echo problem occurs whenever a sound signal is played back by a loudspeaker and subsequently picked up by a microphone that instead serves to capture a local speech signal. This problem is typically encountered in hands-free speech applications since the acoustic coupling between the loudspeaker and the microphone is much more significant in such systems compared to traditional handheld devices. The acoustic feedback problem originates from a similar acoustic coupling, however, in this case the loudspeaker signal is related to the microphone signal and hence a closed signal loop occurs. If the amplifier between the microphone and loudspeaker is turned up to a high gain, then the closed-loop system may become unstable, resulting in annoying howling sounds. Acoustic feedback is often perceived in public address systems and sound reinforcement systems in concert halls. The approach taken in this thesis consists in departing from the traditional ad-hoc methods, and instead deriving theoretically well-founded solutions, based on results from parameter estimation and system identification. This results in a set of novel signal processing algorithms that provide a robust feedback and echo cancellation performance and a good sound quality, at a reasonable computational load.
534.86 <043> --- 621.391 <043> --- 681.5.015 <043> --- Academic collection --- 681.5.015 <043> Identification, modelling, parameters etc.--Dissertaties --- Identification, modelling, parameters etc.--Dissertaties --- 621.391 <043> General questions of electrical communication engineering. Cybernetics. Information theory. Signal theory--Dissertaties --- General questions of electrical communication engineering. Cybernetics. Information theory. Signal theory--Dissertaties --- Sound transmission (radio, television, film). Electroacoustics--Dissertaties --- Theses
Listing 1 - 1 of 1 |
Sort by
|