Up | Next | Prev | PrevTail | Tail |
Sinds de jaren vijftig van de vorige eeuw geniet het vakgebied van information retrieval een toenemende interesse. Al sinds het ontstaan wordt er veel onderzoek gedaan naar het vinden van optimale manieren om documenten en zoekvragen te representeren en naar algoritmes om de twee met elkaar te vergelijken. In gevallen waar expliciete semantische informatie beschikbaar is, bijvoorbeeld in de vorm van documentannotaties, kunnen dergelijke vergelijkingsalgoritmes geïnformeerd worden door gebruik te maken van de concept talen waarin de semantische informatie beschreven is. Dergelijke algoritmes kunnen derhalve zoekvragen en documenten met elkaar vergelijken op basis van zowel tekstuele als semantische evidentie.
Recente inzichten hebben het mogelijk gemaakt om zoekvragen op een gedetailleerde manier te representeren door middel van taalmodellen. Dit leidt er vervolgens toe dat we taalobservaties die geassocieerd zijn met concepten op een principiële en transparante manier in het vergelijkingsmodel kunnen verwerken. Ontwikkelingen in het vakgebied van het semantische web, zoals bijvoorbeeld het Linked Open Data initiatief, maken het mogelijk om op grote schaal tekst te associëren met concepten. Deze twee ontwikkelingen samengenomen zorgen ervoor dat we niet slechts handmatig toegekende concepten in een domein-specifieke context kunnen inzetten, maar ook concepten uit het algemene domein kunnen gebruiken.
Dit proefschrift onderzoekt hoe informatie-ontsluiting verbeterd kan worden door gebruik te maken van taalobservaties rondom concepten en te kijken naar de taal die mensen gebruiken als ze de concepten bespreken. De belangrijkste bijdrage ligt in een verzameling modellen en methodes die de gebruiker in staat stellen informatie op een conceptueel niveau te ontsluiten. Door middel van uitvoerige experimenten wordt een gedetailleerde verkenning en analyse van de effectiviteit van de voorgestelde modellen en methodes verkregen. De empirische resultaten laten zien dat een combinatie van top-down conceptuele informatie en bottom-up statistische informatie de optimale resultaten verkrijgt op een breed scala aan taken en collecties.
Up | Next | Prev | PrevTail | Front |