Beta 1


Title A Framework for Ontology Based Queries in a Semistructured Database for World Heritage
Author Poulsen, Chris
Christensen, Martin R.N.
Institution Technical University of Denmark, DTU, DK-2800 Kgs. Lyngby, Denmark
Thesis level Master's thesis
Year 2003
Abstract World Heritage (WH) is an organization which aims at preserving particularly interesting areas, monuments etc. Each of these "sites" are described on a website. In order to help users navigate the existing World Heritage website, some categorizations have been created. For instance it is possible to browse categories based on location or site type. It is difficult to make good categorizations and take advantage of the possibilities that they offer. But good categorizations expresses a lot of information about the sites that they cover. Categorizations can be used to make some complex queries. For example it is possible to suggest sites that are related to each other based on some category property. The goal of this project is to explore the possibilities that emerging XML technologies offer, and based on the technologies suggest a way of making categorizations of semistructured data. Furthermore we explore the possibilities that categorizations of semistructured data offer, and create a framework that supports easy generation of categorizations. We explore how queries can take advantage of categorizations and how query results can be presented to the users on the WH website in a usable manner. The WH site list contains many different sites, and many of them do not have much in common. This makes it hard to describe all the sites using the same schema. To avoid this problem we use a semistructured data model, and implement a software system that illustrates some of the different principles that applies to semistructured data. The implementation is based on Open Source Software and XML specifications from the World Wide Web Consortium such as XQuery and XPath. In Danish: World Heritage (WH) er en organisation, hvis mål er at bevare specielt interessante områder, monumenter mm. Hver af disse ``lokaliteter'' er beskrevet på en webside. For at hjælpe brugere med at finde rundt i den eksisterende World Heritage webside, er der lavet nogle kategoriseringer. For eksempel er det muligt at ``browse'' kategorier baseret på beliggenhed eller type. Det kan være svært at lave gode kategoriseringer og udnytte de muligheder, som de giver. Men gode kategoriseringer udtrykker en masse information, omkring de lokaliteter de kategoriserer. Kategoriseringer kan anvendes til at konstruere komplekse forespørgsler. For eksempel er det muligt at lave forespørgsler, som foreslår andre lokaliteter, der er relaterede til en valgt lokalitet. Relationen mellem den valgte lokalitet og de relaterede lokaliteter, er indeholdt i kategoriseringerne. Formålet med dette projekt er at udforske de muligheder, som nye XML teknologier tilbyder, samt foreslå, hvordan disse kan benyttes til kategorisering af semistruktureret data. Desuden undersøger vi de anvendelsesmuligheder som kategoriseringer tilbyder, og laver et ``framework'', der kan benyttes til at lave kategoriseringer. Vi undersøger, hvordan forespørgsler kan udnytte kategoriseringer til at lave gode søgefaciliteter, samt hvordan søgeresultater kan præsenteres for besøgende på World Heritage websiden. Listen af lokaliteter under World Heritage indeholder mange forskelligartede lokaliteter, og mange af dem har kun få ting til fælles. Dette gør det problematisk at beskrive alle lokaliteter vha. et fælles skema. For at undgå disse problemer benytter vi en semistruktureret datamodel, og implementerer et softwaresystem, som viser de forskellige principper omkring anvendelse af semistruktureret data. Implementationen er baseret på open source software og XML specifikationer fra World Wide Web Consortium eksempelvis XPath og XQuery.
Imprint Department of Informatics and Mathematical Modeling, Technical University of Denmark, DTU : DK-2800 Kgs. Lyngby, Denmark
Keywords ontology; classification; XQuery; XML; World Heritage; semistructured data
Fulltext
Original PDF imm2545.pdf (1.94 MB)
Admin Creation date: 2006-06-22    Update date: 2012-12-20    Source: dtu    ID: 58654    Original MXD