Beta 1


Title Signalbehandling til lydsøgning
Author Lisberg, Torbjørn Andreas
Supervisor Larsen, Jan (Intelligent Signal Processing, Informatics and Mathematical Modelling, Technical University of Denmark, DTU, DK-2800 Kgs. Lyngby, Denmark)
Institution Technical University of Denmark, DTU, DK-2800 Kgs. Lyngby, Denmark
Thesis level Master's thesis
Year 2007
Abstract Denne afhandling omhandler klassifikation af musiksignaler. Der undersøges hvorvidt det er muligt, at benytte en rytmisk feature, baseret på trommesignalet fra et polyfonisk musiksignal, til at klassificere det pågældende musiksignal efter tilhørende musikgenre. Der undersøges to metoder til, at udføre blind separation af kildesignaler fra et enkeltkanals polyfonisk musiksignal, hvor der er specielt fokus på at kunne separere trommesignalet fra det oprindelige signal. Der undersøges også to metoder til automatisk identifikation af de separerede kildekomponenter der tilhører trommesignalet. Der udtrækkes korttidslige features fra trommesignalet, hvor der benyttes en Multivariabel autoregressiv model, til at integrere de korttidslige features op på en længere tidsskala. De korttidslige features, der undersøges i dette projekt består af såkaldte MPEG-7 features og Mel Cepstrale koefficienter. Der undersøges også en kernel model til tidslig feature integration. Der udføres en række forsøg, hvor de introducerede metoder til separation af kildesignaler, testes for at finde ud af hvilken metode giver den bedste kvalitet for de separerede trommesignaler. Derefter benyttes trommesignalet til at udtrække features fra og der undersøges hvor velegnede disse features er til at klassificere musiksignaler efter musikgenre. Af de to metoder der benyttes til separation af kildesignaler, fremkommer de bedste resultater, ved at benytte en perceptionelt vægtet ikke-negativ faktorisering (PWNMF). Der findes også frem til en forholdsvis robust metode til at identificere de kildekomponenter, der tilhører et trommesignal. Til at undersøge klassifikationsperformance benyttes to musikdatabaser hvor den ene danner basis for de udførte tests. De features der giver bedst resultater benyttes derefter på den større database. Der er også i projekt-forløbet blevet implementeret en Windows applikation, der demonstrerer nogle af de introducerede metoder i praksis. Applikationen er i stand til at anbefale brugeren musik ud fra valgte eksempler.
Series IMM-Thesis-2007-36
Fulltext
Original PDF imm5243.pdf (0.81 MB)
Admin Creation date: 2007-06-11    Update date: 2007-09-19    Source: dtu    ID: 200710    Original MXD