Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/24651
Author: Ιωακειμιδου, Δέσποινα
Title: Extracting graphstructured information from simple text
Alternative Titles: Εξαγωγή πληροφορίας δομημένη ως γραφήματα από απλό κείμενο
Date Issued: 2020
Department: Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης στην Εφαρμοσμένη Πληροφορική
Supervisor: Κολωνιάρη, Γεωργία
Abstract: Η επεξεργασία φυσικής γλώσσας αποτελεί έναν κλάδο της επιστήμης της πληροφορικής που αναπτύσσεται συνεχώς τα τελευταία 70 χρόνια και έχει αλλάξει τον τρόπο που οι άνθρωποι αλληλεπιδρούν με τους υπολογιστές. Με την ανάπτυξη του διαδικτύου τα τελευταία χρόνια καθημερινά δημιουργείται ένας τεράστιος όγκος δεδομένων κειμένου και η σωστής επεξεργασίας τους είναι πλέον αναγκαία. Η διαχείριση και η αποθήκευση των δεδομένων κειμένου έχει προσελκύσει το ενδιαφέρον των ερευνητών με διάφορετικους τρόπουυς ενώ σημαντική είναι επίσης και η ανάλυση των δεδομένων για εμπορικούς λόγους. Η ανάλυση μεγάλου όγκου δεδομένων, που αποτελει ενα κομμάτι της επεξεργασίας φυσικής γλώσσας, αναπτύσσεται πλεον ταχύτατα. Δεδομένου οτι κάθε κείμενο αποτελείται απο μια αλληλουχία λέξεων-δεδομένων, οι οποίες είναι συνδεδεμένες μεταξύ τους συντακτικά και οτι οι βάσεις δεδομένων με γράφους ειναι αρκετα αποδοτικες οταν τα δεδομένα είναι συσχετισμένα, η επεξεργασία φυσικής γλώσσας και η \selectlanguage{english} Neo4j \selectlanguage{greek} αποτελουν εναν αποτελεσματικο συνδυασμό. Η παρούσα εργασία εστιάζει στην επεξεργασία αδόμητου κειμένου και στη δημιουργία γράφου, ο οποίος θα αντιπροσωπεύει τις ιδιότητες των οντοτήτων του κειμένου αλλα και τις συσχετισεις που υπάρχουν. Θεωρείται οτι η προεπεξεργασία του κειμένου είναι αρκετά σημαντική για την επιτυχια του μοντέλου αυτου, καθώς το κείμενο που εισάγεται μπορεί να είναι αρκετά πολύπλοκης μορφής. Με την προεπεξεργασία το αδόμητο κείμενο μετατρέπεται σε μια μορφή διαχειρίσιμη για περαιτέρω ανάλυση, χωρίς όμως να χάνεται πολύτιμη πληροφορία. Τα αποτελέσματα δείχνουν οτι με κάποιες προϋποθέσεις οσον αφορα τη σύνταξη της πρότασης, τα ήδη συσχετισμένα δεδομένα κειμένου οπτικοποιούνται αποδοτικά σε γράφο.
Keywords: Επεξεργασία φυσικης γλώσσας
Γράφος
Βάση δεδομένων με γράφους
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2020.
Rights: CC0 1.0 Παγκόσμια
Appears in Collections:Π.Μ.Σ. στην Εφαρμοσμένη Πληροφορική (M)

Files in This Item:
File Description SizeFormat 
IoakeimidouDespoinaMsc2020.pdf987.3 kBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons