Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/18685
Author: Αγναντής, Κωνσταντίνος
Title: Ευφυή συστήματα στον σημασιολογικό ιστό.
Alternative Titles: Intelligent systems on semantic web.
Date Issued: 2015
Department: Πανεπιστήμιο Μακεδονίας. Τμήμα Εφαρμοσμένης Πληροφορικής (ΕΠ)
Supervisor: Ρεφανίδης, Ιωάννης
Abstract: Ο παραδοσιακός παγκόσμιος ιστός (world wide web) χαρακτηρίζεται από τον ανθρωποκεντρικό προσανατολισμό του, δηλαδή, η πληροφορία βρίσκεται σε μορφή κατανοητή από τον άνθρωπο. Στους παλαιότερους ιστοτόπους η πληροφορία είναι στατική, συνήθως σε μορφή HTML, και σπάνια ενημερώνεται παρά μόνο όταν ο κάτοχος της ιστοσελίδας διαθέσει χρόνο για να την επεξεργαστεί χειρωνακτικά. Αλλά και οι πλέον σύγχρονες ιστοσελίδες, το περιεχόμενο των οποίων δημιουργείται δυναμικά αντλώντας στοιχεία από βάσεις δεδομένων, μολονότι παρουσιάζουν κάποια υποτυπώδη δομή, η τελική πληροφορία και πάλι στοχεύει στην κατανόησή της από τον άνθρωπο επισκέπτη της ιστοσελίδας. Το κενό αυτό έρχεται να καλύψει ο σημασιολογικός ιστός, στοχεύοντας όχι να αντικαταστήσει τον παραδοσιακό ιστό αλλά να συνυπάρξει αρμονικά μαζί του. Τα δεδομένα στον σημασιολογικό ιστό βρίσκονται σε μορφή απολύτως δομημένη, στοχεύοντας έτσι στην εύκολη κατανόησή τους και επεξεργασία από ευφυή συστήματα (χωρίς αυτό να αποκλείει ωστόσο την αυτοματοποιημένη εμφάνισή τους και σε μορφή κατανοητή από άνθρωπο). Η παρούσα διατριβή επικεντρώνεται στη χρήση των ευφυών συστημάτων στον σημασιολογικό ιστό, δίνοντας έμφαση σε εφαρμογές ευφυών ηλεκτρονικών ημερολογίων. Η συνεισφορά της κινείται σε τρεις τομείς: Στη σημασιολογική αναπαράσταση της πληροφορίας, στη χρήση της σε συγκεκριμένα πεδία εφαρμογής και, τέλος, στη δυνατότητα δημιουργίας τέτοιας πληροφορίας από άγνωστες ιστοσελίδες. Αρχικά σχεδιάστηκαν και προτάθηκαν οντολογίες για τη σημασιολογική αναπαράσταση δεδομένων που αφορούν καθημερινές δραστηριότητες ενός χρήστη, με σκοπό τη χρήση τους σε εφαρμογές ευφυών ηλεκτρονικών ημερολογίων. Μολονότι η σχεδίαση έγινε έχοντας υπόψη μια συγκεκριμένη εφαρμογή ευφυούς ημερολογίου, ειδικότερα το σύστημα SelfPlanner, εντούτοις αυτή διατηρήθηκε όσο το δυνατόν πιο γενική, ώστε να μπορεί να χρησιμοποιηθεί και από άλλα αντίστοιχα ευφυή συστήματα, ενώ προστέθηκαν έννοιες και περιπτώσεις χρήσης (π.χ., συναντήσεις) που δεν υποστηρίζονται από τη συγκεκριμένη εφαρμογή. Επιπρόσθετα, αναπτύχθηκε στα πλαίσια της εφαρμογής μια βιβλιοθήκη, με όνομα OntPlanner, για τη μετατροπή της οντολογικής περιγραφής της πληροφορίας σε αντικείμενα Java, ώστε να είναι δυνατή η άμεση εισαγωγή των οντολογικών περιγραφών των καθημερινών δραστηριοτήτων στο σύστημα ευφυούς ημερολογίου. Η βιβλιοθήκη αυτή ενσωματώθηκε στην πλέον πρόσφατη έκδοση του συστήματος SelfPlanner. Στη συνέχεια, αναπτύχθηκε εξολοκλήρου ένα νέο σύστημα, το οποίο στοχεύει στην οντολογική περιγραφή εκπαιδευτικών αντικειμένων, όπως π.χ. ένα εξαμηνιαίο πανεπιστημιακό μάθημα. Το σύστημα Coursr κατέχει περιγραφές εκπαιδευτικών αντικειμένων σε μεγάλο βαθμό λεπτομέρειας όσον αφορά την εσωτερική τους δομή και τις χρονικές τους απαιτήσεις. Έχοντας πρόσβαση στα ημερολόγια του χρήστη, αλλά και στην εφαρμογή ευφυούς ημερολογίου SelfPlanner, είναι σε θέση να χρονοπρογραμματίσει ταυτόχρονα όλες τις δραστηριότητες του χρήστη, εκπαιδευτικές, επαγγελματικές και προσωπικές. Το σύστημα Coursr υποστηρίζει μια επιπλέον οντολογία για την περιγραφή των εκπαιδευτικών αντικειμένων. Ενδιαφέρουσα πρωτοτυπία του συστήματος είναι η χρήση φυσικής (αγγλικής) γλώσσας για την εισαγωγή χρονικών περιγραφών και περιορισμών αναφορικά με τα εκπαιδευτικά αντικείμενα, με τη σχετική γραμματική αλλά και το πρόγραμμα συντακτικής ανάλυσης να έχουν αναπτυχθεί εξαρχής για τις ανάγκες της διατριβής. Το σύστημα Coursr αξιολογήθηκε από σημαντικό αριθμό τελικών χρηστών με ιδιαίτερα ενθαρρυντικά αποτελέσματα. Τέλος, στα πλαίσια της διατριβής έγινε προσπάθεια να εξαχθούν σημασιολογικές περιγραφές δραστηριοτήτων από απλό κείμενο σε άγνωστες ιστοσελίδες. Διερευνήθηκε η περίπτωση των μαθημάτων των παραδοσιακών πανεπιστημίων, όπου όμως διαπιστώθηκε πως η διαθέσιμη πληροφορία αφενός είναι ιδιαίτερα πολύπλοκη, αφετέρου στις περισσότερες περιπτώσεις δεν είναι διαθέσιμη. Κατά συνέπεια, για ευφυή συστήματα σαν το Coursr, προτείνεται η υιοθέτησή τους από μεγάλους εκπαιδευτικούς οργανισμούς και η τροφοδότησή τους με περιγραφές εκπαιδευτικών αντικειμένων. Ως πιο απλή περίπτωση εξετάστηκε η εξαγωγή σημασιολογικής περιγραφής δραστηριοτήτων που αφορούν επιστημονικά συνέδρια, όπως υποβολή ερευνητικής εργασίας, αναθεώρηση της εργασίας, προετοιμασία της παρουσίασης και τέλος παρακολούθηση του συνεδρίου. Αναπτύχθηκε λογισμικό, με όνομα FuzzyExtractor, το οποίο, διαβάζοντας την ιστοσελίδα ενός συνεδρίου, ανακαλύπτει τις κρίσιμες ημερομηνίες και δημιουργεί οντολογικές περιγραφές δραστηριοτήτων σχετικών με το συνέδριο, οι οποίες θα μπορούσαν να εισαχθούν στο ευφυές ηλεκτρονικό ημερολόγιο του χρήστη.
Traditional World Wide Web is human-centric, that is, information is available in human readable format. In older web sites information is static, usually in HTML, and is updated only when their owners devote time to edit it manually. On the other hand, modern sites have their content being dynamically pumped by databases and, although they exhibit some form of structure, the information is again targeting the human visitor of the web page. This gap aims to fill cover the semantic web, not by replacing the traditional web but by harmonically coexisting with it. Information in semantic web is in an absolutely structured format, aiming at its interpretation and editing by intelligent systems (without this to preclude its automated appearance in human-readable format). This thesis focuses on the use of intelligent systems in semantic web, giving emphasis in intelligent calendar applications. Its contribution is three-fold: Semantic representation of the information; its exploitation in specific application domains; and, finally, creating semantically annotated information from simple web pages. Initially, we have designed and proposed ontologies for semantically representing information that concerns daily human activities, in order to be exploited by intelligent calendar applications. Although we started the design of the ontologies having the already deployed intelligent calendar application SELFPLANNER in mind, the ontologies were developed fairly general so as to be usable in other similar systems as well. Furthermore, new concepts and use cases were added (e.g., meetings), that were not supported by the particular application. Finally, we have developed a library, named ONTPLANNER, to convert ontological descriptions of activities described with the proposed ontologies to Java objects, so as to directly insert them into an intelligent calendar application. This library has been integrated in the latest version of SELFPLANNER. Next, we have developed from the grounds a new intelligent system, aiming at the ontological description of educational objects, such as a university class. The new system, called COURSR, possesses descriptions of educational objects about their temporal aspects and requirements with a fine-grained level of detail. The system is able to connect with the student’s calendars, as well as with SELFPLANNER, to schedule simultaneously all of his activities, including educational, professional and personal ones. COURSR supports a new ontology about the structure and temporal aspects of educational objects. An interesting innovative feature concerns the use of natural (English) language to describe periodicity and constraints over their activities, with the underlying grammar and the parser having been developed from the grounds for this thesis. COURSR was evaluated with real users (teachers and students) with very promising results. Finally, within this thesis we have tried to extract semantic descriptions of activities from text in unknown pages. First we focused on information for educational objects, using university sites as the information source. However, the fine-grained level of information we were looking for was very complex and in most cases not available. Thus, for intelligent systems like COURSR we propose their adoption from large educational institutions and their feeding with educational object descriptions. As a simpler use case, we examined the extraction of semantically annotated information concerning activities related to attending a scientific conference, like submitting a research paper, sending the camera ready version of it, preparing the presentation and, of course, going to the conference and attending it. We have developed a system, called FUZZYEXTRACTOR, that, by reading the unknown web page of a conference, extracts all the critical dates and created ontological descriptions of the related activities in a form ready to insert to the user’s intelligent calendar application.
Keywords: Οντολογίες
Σημασιολογικός ιστός
Ευφυή ημερολόγια
Εξαγωγή πληροφορίας
Ontologies
Semantic web
Intelligent calendars
Information extraction
Information: Η βιβλιοθήκη διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή.
Διατριβή (Διδακτορική)--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2015.
Περιλαμβάνει βιβλιογραφικές αναφορές (σ. 176-183).
018/2015
Appears in Collections:Τμήμα Εφαρμοσμένης Πληροφορικής (Δ)

Files in This Item:
File Description SizeFormat 
AgnantisKonstantinos_license.pdf69.36 kBAdobe PDFView/Open
AgnantisKonstantinos_Phd2015.pdf5.05 MBAdobe PDFView/Open


Items in Psepheda are protected by copyright, with all rights reserved, unless otherwise indicated.