Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/29092
Author: Παπαδιώτη, Σπυριδούλα
Papadioti, Spyridoula
Title: Analyzing the refugee crisis in Greece through twitter: topic modelling and network analysis
Alternative Titles: Ανάλυση της προσφυγικής κρίσης στην Ελλάδα μέσω του twitter: θεματική μοντελοποίηση και ανάλυση δικτύων
Date Issued: 2023
Department: Πρόγραμμα Μεταπτυχιακών Σπουδών Αναλυτική των Επιχειρήσεων και Επιστήμη των Δεδομένων
Supervisor: Γεωργίου, Ανδρέας
Georgiou, Andreas
Abstract: Social media platforms have become an integral part of the public discourse and researchers continue to turn to data mined from social media to understand public opinions on a variety of topics. This study investigates the public discussion on Twitter regarding the refugee crisis in Greece throughout the period 2015 – 2021, using a total of 116,530 mined tweets utilizing the hashtag #RefugeesGR. This hashtag proved crucial for mining data that captures a wide spectrum of discussion around refugees, as it was extensively used by a large variety of Twitter account types, including verified, professional and personal accounts. The dataset of mined tweets was analyzed via a topic modelling algorithm based on Latent Dirichlet Allocation and yielded results that were on par with the analysis of real-world events from that period in Greece. Topics that maintained popularity throughout the years include refugee boat arrivals on the Greek islands, the living conditions in formal and informal refugee camps across Greece and calls-to-action for humanitarian aid and in solidarity with refugees, while a shift was observed in the geographic-related discussion on refugees from the border region of Greece with North Macedonia during 2015 – 2016 to the border region with Turkey from 2017 onwards. The interactions, particularly mentions, between Twitter users using the hashtag #RefugeesGR were investigated using network analysis and visualization, revealing that the most influential accounts within the network belonged to International Humanitarian Organizations, EU governmental bodies, and individual (international and local) politicians. Social network analysis was enhanced with community detection, forming clusters of accounts that were not grouped together based on similar characteristics in terms of user type, but rather on the accounts which were more frequently called-to-action at the same time, thus bringing together accounts that were co-relevant within a specific time-period. This study serves as an attestation to the value of data mined from Twitter and the reliable insights on real-world events that could be derived from tweets.
Οι πλατφόρμες των μέσων κοινωνικής δικτύωσης έχουν γίνει αναπόσπαστο μέρος του δημόσιου διαλόγου και οι ερευνητές συνεχίζουν να χρησιμοποιούν δεδομένα που εξορύσσονται από τα μέσα κοινωνικής δικτύωσης για να κατανοήσουν τις απόψεις του κοινού για μια πληθώρα θεματικών. Αυτή η μελέτη ερευνά τη δημόσια συζήτηση στο Twitter σχετικά με την προσφυγική κρίση στην Ελλάδα κατά την περίοδο 2015 – 2021, χρησιμοποιώντας ένα σύνολο από 116,530 εξορυγμένα tweets που περιλαμβάνουν το hashtag #RefugeesGR. Το hashtag αυτό αποδείχθηκε κρίσιμο στην εξόρυξη δεδομένων που καλύπτουν ένα ευρύ φάσμα συζητήσεων γύρω από το προσφυγικό, καθώς χρησιμοποιήθηκε εκτενώς από διαφόρων τύπων λογαριασμών Twitter, συμπεριλαμβανομένων επαληθευμένων, επαγγελματικών και προσωπικών λογαριασμών. Η βάση δεδομένων των tweet που εξορύχθηκαν αναλύθηκε μέσω ενός αλγόριθμου θεματικής μοντελοποίησης που βασίζεται στη Latent Dirichlet Allocation και τα αποτελέσματα αυτής συνάδουν με την ανάλυση αληθινών γεγονότων εκείνης της περιόδου στην Ελλάδα. Οι θεματικές που διατήρησαν υψηλή δημοτικότητα ανά τις χρονιές περιλαμβάνουν τις αφίξεις βαρκών με πρόσφυγες στα ελληνικά νησιά, τις συνθήκες διαβίωσης σε επίσημες δομές φιλοξενίας και ανεπίσημους προσφυγικούς καταυλισμούς της Ελλάδας, καθώς και τις εκκλήσεις σε δράση για παροχή ανθρωπιστικής βοήθειας και προς αλληλεγγύη με τους πρόσφυγες, ενώ παρατηρήθηκε μια στροφή στη γεωγραφική συζήτηση του προσφυγικού από τη συνοριακή περιοχή της Ελλάδας με τη Βόρεια Μακεδονία κατά την περίοδο 2015 – 2016 στη συνοριακή περιοχή με την Τουρκία από το 2017 και έπειτα. Οι αλληλεπιδράσεις μεταξύ χρηστών του Twitter που κάνουν αναφορά στο hashtag #RefugeesGR διερευνήθηκαν χρησιμοποιώντας ανάλυση και οπτικοποίηση δικτύων, αποκαλύπτοντας ότι οι λογαριασμοί με τη μεγαλύτερη επιρροή στο δίκτυο ανήκουν σε Διεθνείς Ανθρωπιστικούς Οργανισμούς, κυβερνητικούς φορείς της ΕΕ, καθώς και σε προσωπικούς λογαριασμούς (διεθνών και τοπικών) πολιτικών προσώπων. Η ανάλυση του κοινωνικού δικτύου ενισχύθηκε μέσω της ανίχνευσης κοινοτήτων, σχηματίζοντας συστάδες λογαριασμών που δεν ομαδοποιήθηκαν με βάση τα παρόμοια χαρακτηριστικά τους όσον αφορά στον τύπο χρήστη, αλλά με βάση τους λογαριασμούς που καλούνταν πιο συχνά σε δράση ταυτόχρονα, ομαδοποιώντας έτσι μαζί λογαριασμούς που ήταν ταυτοχρόνως σχετικοί σε μια συγκεκριμένη χρονική περίοδο. Αυτή η μελέτη αποτελεί μια επιβεβαίωση ως προς την αξία των δεδομένων που εξορύσσονται από το Twitter, καθώς και των αξιόπιστων πληροφοριών σχετικά με γεγονότα του πραγματικού κόσμου που θα μπορούσαν να προκύψουν από τα tweets.
Keywords: RefugeesGR
data mining
data scraping
twitter mining
twitter scraping
text cleaning
text pre-processing
natural language processing
NLP
topic analysis
topic detection
topic modelling
LDA
LDAvis
community detection
graphs
network analysis
network metrics
network visualization
Gephi
social network analysis
SNA
OSINT
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2023.
Rights: Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
Appears in Collections:ΠΜΣ Αναλυτική των Επιχειρήσεων και Επιστήμη των Δεδομένων (Μ)

Files in This Item:
File Description SizeFormat 
PapadiotiSpyridoulaMSc2023.pdf8.35 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons