Beta 1


Title Multivariat dataanalyse af 2D-elektroforesegeler
Author Skettrup, Mia
Supervisor Ersbøll, Bjarne Kjær (Department of Informatics and Mathematical Modeling, Technical University of Denmark, DTU, DK-2800 Kgs. Lyngby, Denmark)
Institution Technical University of Denmark, DTU, DK-2800 Kgs. Lyngby, Denmark
Thesis level Master's thesis
Year 2003
Abstract Dette projekts formål er at undersøge, om det med multivariat dataanalyse er muligt at finde enkelt-proteiner eller grupper af proteiner i hjernevæv, der adskiller epilepsiramte rotter fra en gruppe raske rotter. Proteinsammensætningen i hjernevæv fra rotter er bestemt ved hjælp af 2d-elektroforesegeler. Der blev analyseret prøver fra 19 rotter, dels fra 12 rotter med tre forskellige grader af epilepsi (under udvikling, mild og svær) og dels fra en kontrolgruppe af 7 raske rotter. Datasættet består således af 19 observationer og 1849 variable (forskellige proteiner). Det er i dag standard at benytte univariate metoder til statistisk analyse af data fra 2d-elektroforesegeler, og som sammenligningsgrundlag for de, i dette projekt, benyttede multivariate analyser, er der udført en ikke-parametrisk ensidet variansanalyse og en t-test. Multivariate statistiske metoder tager, modsat de univariate metoder, højde for korrelationer mellem variablene. Metoderne kan deles op i to hovedgrupper, ikke-superviserede og superviserede. De ikke-superviserede metoder omfatter principal komponentanalyse, faktoranalyse, clusteranalyse og kanonisk korrelationsanalyse, mens de superviserede metoder omfatter diskriminantanalyse, logistisk regression og klassifikationstræer. Principal komponentanalyse og kanonisk korrelationsanalyse viste sig rimelig velegnede til at adskille de tre syge grupper af rotter fra hinanden og fra de raske. Med faktoranalyse og clusteranalyse er det muligt at inddele de 1849 variable i mindre grupper, hvor nogle af disse ser ud til at være interessante i forbindelse med epilepsi. Af de superviserede metoder var det kun diskriminantanalysen, der viste sig velegnet til data, og med denne blev fundet et par variable, som ser ud til at have en indflydelse på, om rotten har epilepsi eller ej, og hvilken grad af epilepsi der kunne være tale om.
Imprint Institut for Informatik og Matematisk Modellering, Danmarks Tekniske Universitet, DTU : DK-2800 Kgs. Lyngby, Denmark
Fulltext
Original PDF imm2386.pdf (1.21 MB)
Admin Creation date: 2006-06-22    Update date: 2012-12-20    Source: dtu    ID: 58657    Original MXD