Classification of audio sources using ad-hoc microphone arrays

  • The automatic classification of audio sources is an important ingredient in many audio signal processing algorithms, e.g., for noise reduction or acoustic scene analysis. Possible applications are, e.g., in the field of telecommunication or automatic speech recognition. In a real world scenario however, the classification constitutes a difficult problem. Often, reverberation and interfering sounds reduce the quality of a target source signal. To classify disturbed signals more accurately the spatial distribution of microphones from ad-hoc microphone arrays can be exploited. In this work we present a system which processes signals from ad-hoc distributed microphones in order to classify multiple simultaneously active and spatially distributed sources. It is shown that the classification accuracy is higher when clusters of microphones are estimated and audio feature information is exchanged within and in between the clusters compared to the classification based on single microphones.
  • Die automatische Klassifikation von akustischen Quellen ist Bestandteil vieler Algorithmen der Audiosignalverarbeitung, z.B. bei der Reduktion von Störanteilen in einem Signal oder der Analyse akustischer Szenen. Mögliche Anwendungen finden sich u. a. in der Telekommunikation und in der automatischen Spracherkennung. Die Klassifikation ist insb. dann eine anspruchsvolle Aufgabe, wenn Signale, die mit einem Mikrofon empfangen werden, durch räumlich bedingten Nachhall beeinflusst werden und wenn mehrere Quellen in einem Raum simultan aktiv sind. In der vorliegenden Arbeit wird ein System vorgestellt, das die Signale eines Ad-hoc Mikrofon-Arrays verarbeitet um Schallquellen in einer halligen Umgebung zu klassifizieren. Werden automatisch ermittelte Mikrofon-Cluster und die entwickelten Strategien zur Kombination der Informationen zwischen den Clustern genutzt, lassen sich akustische Quellen mit einer höheren Genauigkeit als unter der Verwendung einzelner Mikrofonsignale klassifizieren

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Sebastian GergenGND
URN:urn:nbn:de:hbz:294-46276
Referee:Rainer MartinORCiDGND, Simon DocloGND, Christina PöpperGND
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):2016/02/25
Date of first Publication:2016/02/25
Publishing Institution:Ruhr-Universität Bochum, Universitätsbibliothek
Granting Institution:Ruhr-Universität Bochum, Fakultät für Elektrotechnik und Informationstechnik
Date of final exam:2015/07/08
Creating Corporation:Fakultät für Elektrotechnik und Informationstechnik
GND-Keyword:Klassifikation; Digitales Tonsignal; Akustische Signalverarbeitung; Mikrofon; Akustik
Institutes/Facilities:Institut für Kommunikationsakustik
Dewey Decimal Classification:Technik, Medizin, angewandte Wissenschaften / Elektrotechnik, Elektronik
faculties:Fakultät für Elektrotechnik und Informationstechnik
Licence (German):License LogoKeine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht