Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/24412
Author: Παπατζίκος, Νικόλαος
Title: Εξαγωγή οντολογιών από αδόμητο κείμενο με τη χρήση κατάλληλων εργαλείων
Date Issued: 2020
Department: Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης στην Εφαρμοσμένη Πληροφορική
Supervisor: Κολωνιάρη, Γεωργία
Abstract: Στον Σημασιολογικό Ιστό, οι οντολογίες ορίζουν τις έννοιες και τις σχέσεις που χρησιμοποιούνται για να περιγράψουν και να αντιπροσωπεύσουν έναν τομέα ενδιαφέροντος. Οι οντολογίες χρησιμοποιούνται για να ταξινομήσουν τους όρους που μπορούν να χρησιμοποιηθούν σε μια συγκεκριμένη εφαρμογή, να χαρακτηρίσουν πιθανές σχέσεις και να καθορίσουν πιθανούς περιορισμούς στη χρήση αυτών των όρων. Η OWL (Web Ontology Language) είναι μια γλώσσα Σημασιολογικού Ιστού που έχει σχεδιαστεί για χρήση από εφαρμογές οι οποίες χρειάζεται να επεξεργάζονται το περιεχόμενο των πληροφοριών αντί να παρουσιάζουν μόνο πληροφορίες στον άνθρωπο. Η οντολογία OWL περιγράφει την ιεραρχική οργάνωση των ιδεών σε έναν τομέα, με τρόπο που μπορεί να αναλυθεί και να κατανοηθεί από το λογισμικό. Συνήθως, ο ορισμός οντολογιών για έναν τομέα ενδιαφέροντος γίνεται από ειδικούς του τομέα και είναι μια δύσκολη και χρονοβόρα εργασία. Η αυτόματη εξαγωγή οντολογιών από δομημένη πληροφορία έχει επιλύσει επιμέρους αυτό το πρόβλημα. Ωστόσο, αφού περισσότερη πληροφορία βρίσκεται σε αδόμητη μορφή διαθέσιμη στον παγκόσμιο ιστό, ένα ενδιαφέρον και πιο δύσκολο πρόβλημα είναι η αυτόματη εξαγωγή οντολογιών από έγγραφα σε φυσική γλώσσα. Στόχος της εργασίας είναι η πειραματική μελέτη της εφαρμογής εκμάθησης οντολογιών Text2Onto για την αυτόματη εξαγωγή οντολογικής γνώσης, σε γλώσσα OWL, από κείμενο σε φυσική γλώσσα. Η εφαρμογή Text2Onto είναι ένα από τα ελάχιστα εργαλεία εκμάθησης οντολογιών το οποίο έχει αναπτυχθεί για να υποστηρίξει τη δημιουργία οντολογιών από αδόμητο κείμενο. Η μεθοδολογία που ακολουθήθηκε συνοψίζεται στα παρακάτω βήματα:  Μελέτη της εφαρμογής Text2Onto και της σχετικής τεκμηρίωσης. Πειραματισμός με τη χρήση της εφαρμογής.  Πειραματισμός με τη χρήση διαφόρων ειδών δεδομένων ως είσοδο. Θεωρήθηκε σκόπιμο να επιλεχθεί ως τομέας πειραματισμού, ένας τομέας ενδιαφέροντος διαδεδομένος σε ένα ευρύ φάσμα ανθρώπων, γι’ αυτό και επιλέχθηκε ο τομέας των κινηματογραφικών ταινιών και τηλεοπτικών σειρών. Επιλέχθηκαν ως δεδομένα, κριτικές και στοιχεία ταινιών και σειρών από διάφορες πηγές.  Πειραματισμός με ποσοτικές μεταβολές των δεδομένων και τη χρήση διαφορετικού συνδυασμού αλγορίθμων της εφαρμογής Text2Onto. Μελέτη των αντίστοιχων αποτελεσμάτων οντολογιών που προκύπτουν.  Ποσοτική και ποιοτική ανάλυση των αποτελεσμάτων με έλεγχο και επεξεργασία του εξαγόμενου αρχείου (.owl). Είσοδος των εξαγόμενων αποτελεσμάτων στο περιβάλλον οντολογιών Protégé. Σύγκριση της εξαγόμενης οντολογίας με ένα πρότυπο οντολογίας σχετικά με κινηματογραφικές ταινίες. Για όλα τα παραπάνω αναπτύχθηκαν διαδικασίες κώδικα σε γλώσσα προγραμματισμού Javascript.  Δημιουργία γραφημάτων σχετικών με την ερευνητική δραστηριότητα με σκοπό την αποτίμησή της.  Εξαγωγή συμπερασμάτων για το αν μπορούν και σε τι βαθμό να αξιοποιηθούν οι κριτικές ταινιών για τη δημιουργία οντολογίας.  Εξαγωγή συμπερασμάτων σχετικά με την έκταση των δυνατοτήτων της εφαρμογής και τους τρόπους χρησιμοποίησής της ως εργαλείο στον τομέα των οντολογιών.
Keywords: Σημασιολογικός Ιστός
Οντολογίες
Owl
Text2Onto
Κινηματογραφικές ταινίες
Protege
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2020.
Rights: Αναφορά Δημιουργού 4.0 Διεθνές
Appears in Collections:Π.Μ.Σ. στην Εφαρμοσμένη Πληροφορική (M)

Files in This Item:
File Description SizeFormat 
PapatzikosNikolaosMsc2020.pdf11.17 MBAdobe PDFView/Open
Papatzikosextra.rar9.81 MBRAR Compression FormatView/Open


This item is licensed under a Creative Commons License Creative Commons