Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/26650
Author: Κακογιάννης, Ανδρέας
Title: Ανάλυση συναισθήματος σε δεδομένα του Twitter με τεχνικές NLP
Date Issued: 2022
Department: Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα
Supervisor: Πρωτόγερος, Νικόλαος
Abstract: Τα τελευταία έτη, η χρήση των μέσων κοινωνικής δικτύωσης έχει αυξηθεί δραματικά. Αυτό, όπως γίνεται κατανοητό, προκαλεί τη συνεχή παραγωγή τεράστιου όγκου δεδομένων. Αρκεί να σκεφτούμε πως καθημερινά, εκατομμύρια χρήστες από όλο τον κόσμο μοιράζονται απόψεις, μηνύματα και αρχεία πολυμέσων. Αυτός είναι και ο λόγος που συνεχώς αυξάνεται το ενδιαφέρον για την ανάλυση και την αξιοποίηση των δεδομένων των κοινωνικών δικτύων καθώς συμβάλλει στη διαδικασία λήψης αποφάσεων. Βέβαια, ο τεράστιος αυτός όγκος δεδομένων που παράγεται σε καθημερινή βάση από τα κοινωνικά μέσα δεν μπορεί να διαχειριστεί πλέον με παραδοσιακούς τρόπους αποθήκευσης ,επεξεργασίας και ανάλυσης καθώς κατατάσσεται στον όρο Μεγάλα Δεδομένα (Big Data) και έχουν προκύψει νέες καινοτόμες τεχνολογίες για την διαχείριση τους. Μπορούμε να πούμε, πως η ανάλυση συναισθήματος ή εξόρυξη γνώμης αποτελεί ένα κρίσιμο πεδίο και όπως ήταν είναι φυσικό, έχει προσελκύσει το έντονο ενδιαφέρον και της επιστημονικής κοινότητας. Η ανάπτυξη του Παγκόσμιου Ιστού 2.0 (Web 2.0) ήταν καταλυτικός παράγοντας στη μετεξέλιξη του διαδικτύου, προσδίδοντάς του μια σαφώς πιο κοινωνική διάσταση. Οδήγησε σε μια νέα παγκόσμια πραγματικότητα με τη ραγδαία εξάπλωση των Κοινωνικών Δικτύων και την εκρηκτική αύξηση της αλληλεπίδρασης των ανθρώπων είτε με την έκφραση απόψεων μέσω των κοινωνικών δικτύων για οποιοδήποτε ζήτημα ή πρόσωπο απασχολεί την κοινή γνώμη είτε με την διατύπωση κριτικών σε προϊόντα και υπηρεσίες. Ένα από τα πιο επίκαιρα θέματα, που απασχόλησε τους τελευταίους μήνες με την άφιξη της πανδημίας, τόσο την ελληνική όσο τη διεθνή κοινή γνώμη είναι τα εμβόλια κατά της covid-19 και με αυτό θα ασχοληθούμε στην παρούσα εργασία. Η παρούσα εργασία εστιάζει στην ανάλυση και την ταξινόμηση των αναρτήσεων κειμένου (tweets) των χρηστών του Twitter μέσω της διεπαφής Twitter API που μας προσφέρει το κοινωνικό δίκτυο, σε θετικά, αρνητικά ή ουδέτερα. Για την συλλογή και την επεξεργασία των δεδομένων αξιοποιήσαμε τις δυνατότητες που μας παρέχει η γλώσσα Python σε συνδυασμό με το εργασιακό περιβάλλον Colab.Research της Google. Η απόδοση πολικότητας συναισθήματος στα κείμενα των tweets έγινε με τη χρήση λεξικών των βιβλιοθηκών της Python όπως το TextBlob μια βιβλιοθήκη επεξεργασίας δεδομένων κειμένου και φυσικής γλώσσας. Η οπτικοποίηση και απεικόνιση των δεδομένων του κειμένου έγινε με το Word Cloud, μια τεχνική στην οποία το μέγεθος κάθε λέξης υποδεικνύει τη συχνότητα ή τη σημασία της. Στη συνέχεια, οι πληροφορίες των συλλεχθέντων tweets και τα αποτελέσματα που εξάγονται από την ανάλυση συναισθήματος αποθηκεύονται σε ένα αρχείο .csv. Τέλος παρουσιάστηκαν τα αποτελέσματα της ανάλυσης συναισθήματος και τα συμπεράσματα της μελέτης.
Keywords: Big Data
Sentiment Analysis
Machine Learning
Web 2.0
Twitter API
Covid-19
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2022.
Rights: Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
Appears in Collections:ΔΠΜΣ Πληροφοριακά Συστήματα (M)

Files in This Item:
File Description SizeFormat 
KakogiannisAndreasMSc2022.pdf4.07 MBAdobe PDFView/Open
KakogiannisAndreasMSc2022present.pdf1.78 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons