Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/24596
Author: Τσουκανάρα, Ευαγγελία
Title: Διαγλωσσική ανάλυση συναισθήματος σε ελληνικά tweets
Date Issued: 2019
Department: Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης στην Εφαρμοσμένη Πληροφορική
Supervisor: Κολωνιάρη, Γεωργία
Keywords: Cross-lingual, sentiment analysis
Tweets
Opinion mining
Machine learning
Machine translation
Twitter
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2019.
Η ανάλυση συναισθήματος ή εξόρυξη γνώμης αποτελεί ένα κρίσιμο πεδίο και έχει προσελκύσει το έντονο ενδιαφέρον της επιστημονικής κοινότητας. Η ανάπτυξη του Web 2.0, οδήγησε σε μια νέα παγκόσμια πραγματικότητα με εκρηκτική αύξηση της αλληλεπίδρασης των ανθρώπων είτε με την έκφραση απόψεων μέσω των κοινωνικών δικτύων για οποιοδήποτε ζήτημα ή πρόσωπο απασχολεί την κοινή γνώμη είτε με την διατύπωση κριτικών σε προϊόντα και υπηρεσίες. Επιπρόσθετα, στα πλαίσια της παγκοσμιοποίησης γίνεται επιτακτική η ανάγκη της ανάλυσης του συνόλου των απόψεων, ανεξάρτητα από τη γλώσσα που χρησιμοποιείται. Είναι γεγονός ότι η έρευνα στο πεδίο της ανάλυσης συναισθήματος αναπτύχθηκε κατά βάση στην αγγλική γλώσσα. Η διαγλωσσική ανάλυση συναισθήματος εξετάζει τρόπους αξιοποίησης εργαλείων και μέσων που έχουν αναπτυχθεί σε άλλες γλώσσες. Η παρούσα εργασία εστιάζει στη διαγλωσσική ανάλυση συναισθήματος σε ελληνικά δεδομένα του Twitter, προσεγγίζει το ζήτημα ως πρόβλημα δυαδικής ταξινόμησης και διερευνά το βέλτιστο τρόπο που μπορεί να πραγματοποιηθεί συγκρίνοντας τρεις μεθόδους. Οι δύο πρώτες μέθοδοι χρησιμοποιούν τη μηχανική μετάφραση και στη συνέχεια, την ανάλυση των δεδομένων με εργαλεία για την αγγλική γλώσσα. Η τρίτη μέθοδος αναλύει απευθείας τα ελληνικά δεδομένα, χρησιμοποιώντας εργαλεία που αναπτύχθηκαν για την ελληνική γλώσσα. Η διαδικασία για τις τρεις μεθόδους είναι κοινή και ξεκινά με την προ-επεξεργασία των δεδομένων, σε επόμενο στάδιο γίνεται η εξαγωγή χαρακτηριστικών και τέλος η εκπαίδευση και η αξιολόγηση του μοντέλου. Τα αποτελέσματα των πειραμάτων δείχνουν ότι τα μοντέλα μας μπορούν να επιτύχουν ακρίβεια μέχρι και 84% για το σύνολο των μεθόδων, ενώ παράλληλα η τεχνική του κλαδέματος χαρακτηριστικών λειτουργεί θετικά για τις δύο από τις τρεις μεθόδους.
Rights: Αναφορά Δημιουργού-Μη Εμπορική Χρήση 4.0 Διεθνές
Appears in Collections:Π.Μ.Σ. στην Εφαρμοσμένη Πληροφορική (M)

Files in This Item:
File Description SizeFormat 
TsoukanaraEuangeliaMsc2019.pdf934.71 kBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons