Please use this identifier to cite or link to this item: http://dspace.lib.uom.gr/handle/2159/22982
Author: Παπαδοπούλου, Ευδοξία
Title: Mining historical social data for detecting persistent labeled communities
Alternative Titles: Εξόρυξη ιστορικών κοινωνικών δεδομένων για την ανίχνευση επισημασμένων κοινοτήτων με διάρκεια στο χρόνο
Date Issued: 2018
Department: Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης στην Εφαρμοσμένη Πληροφορική
Supervisor: Κολωνιάρη, Γεωργία
Abstract: Οι γράφοι είναι μια πολύ συνηθισμένη αναπαράσταση δικτύων της πραγματικής ζωής και η εξαγωγή πληροφοριών από αυτούς έχει προκαλέσει το έντονο ενδιαφέρον της ερευνητικής κοινότητας. Η παρούσα προσέγγιση αφορά στην ανίχνευση κοινοτήτων σε δίκτυα που εξελίσσονται στο χρόνο και στον εντοπισμό αυτών των κοινοτήτων που συνεχίζουν να εμφανίζονται στην πάροδο του χρόνου και χαρακτηρίζονται από λέξεις -κλειδιά με συνεχή εμφάνιση στον εξεταζόμενο χρονικό ορίζοντα. Η προτεινόμενη προσέγγιση συνδυάζει έννοιες και τεχνικές που έχουν προταθεί για τη λύση των επιμέρους προβλημάτων που συνθέτουν το στόχο μας και αφορούν στον εντοπισμό κοινοτήτων σε μεγάλης κλίμακας δίκτυα (και κυρίως κοινωνικά δίκτυα), στη διαχείριση και μελέτη δικτύων που εξελίσσονται στο χρόνο, και τέλος στην εξαγωγή ετικετών που χαρακτηρίζουν τις κοινότητες κοινωνικών δικτύων. Το πρώτο βήμα της προτεινόμενης μεθοδολογίας διαιρεί τον χρονικό ορίζοντα σε διακριτά χρονικά διαστήματα, και εστιάζει στην εύρεση των κοινοτήτων που υπάρχουν σε καθένα από αυτά τα χρονικά διαστήματα. Στη συνέχεια εξάγονται οι ετικέτες που χαρακτηρίζουν τις κοινότητες που βρέθηκαν. Αυτές μπορούν να είναι είτε νούμερα είτε αριθμοί, εξαρτώνται από τη φύση του δικτύου και παρέχουν σημασιολογική πληροφορία για το δίκτυο και τις επιμέρους κοινότητες. Για την ανίχνευση της ανθεκτικότητας των κοινοτήτων στο χρόνο, συγκρίνονται οι κοινότητες που έχουν εντοπιστεί σε διαδοχικά χρονικά διαστήματα έτσι ώστε να ανιχνευθεί αν και για πόσο μια κοινότητα συνεχίζει να υφίσταται στο χρόνο. Για να θεωρηθεί μια κοινότητα ότι έχει συνεχή εμφάνιση στο χρόνο πρέπει ένα ποσοστό των οντοτήτων που την αποτελούν να παραμένει σταθερό. Συγκεκριμένα, το εξεταζόμενο χρονικό διάστημα και το αρχικό στιγμιότυπο του δικτύου δίνονται σαν είσοδο σε έναν αναδρομικό αλγόριθμο και το αποτέλεσμα του είναι οι κοινότητες που συνεχίζουν να εμφανίζονται στο δοθέν χρονικό διάστημα μαζί με τις ετικέτες τους που παρουσιάζονται κάθε χρονιά. Η προτεινόμενη μεθοδολογία εφαρμόστηκε σε ένα δίκτυο που αποτελείται από συγγραφείς ερευνητικών δημοσιεύσεων για το οποίο χρησιμοποιήθηκαν δεδομένα δημοσιεύσεων από το 1980 μέχρι το 2010 και σαν ετικέτες χρησιμοποιήθηκαν οι λέξεις των τίτλων των δημοσιεύσεων των συγγραφέων. Η προτεινόμενη μέθοδος εφαρμόστηκε για διαφορετικά χρονικά διαστήματα και με ποικίλα στιγμιότυπα του βιβλιογραφικού δικτύου σαν αρχική κατάσταση και εξάχθηκαν διάφορα συμπεράσματα για το υπό μελέτη δίκτυο. Καταρχήν, εντοπίστηκαν λίγες ανθεκτικές κοινότητες που διατηρούνται για μεγάλα χρονικά διαστήματα, κι αυτές μειωνόταν όσο αυξανόταν τα εξεταζόμενα χρονικά διαστήματα. Τα μεγαλύτερα χρονικά διαστήματα δείχνουν ότι δεν υπάρχουν πολλές κοινότητες που συνεχίσουν να εμφανίζονται στο χρόνο, χαρακτηριζόμενες από τουλάχιστον μια σταθερή ετικέτα Επίσης μετά το 2000 οι ανθεκτικές κοινότητες είναι περισσότερες ίσως λόγο της αύξησης της δραστηριότητας της ερευνητικής κοινότητας. Επιπρόσθετα φαίνεται να υπάρχουν θέματα γενικού ενδιαφέροντος που συνεχίζουν να προσελκύουν το ενδιαφέρον της ερευνητικής κοινότητας στην πάροδο του χρόνου στον εξεταζόμενο χρονικό διάστημα αλλά εμφανίζονται σε διαφορετικές κοινότητες.
Keywords: Γράφος
Εξέλιξη στο χρόνο
Εντοπισμός κοινοτήτων
Εξαγωγή ετικετών
Information: Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2018.
Rights: Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Appears in Collections:Π.Μ.Σ. στην Εφαρμοσμένη Πληροφορική (M)

Files in This Item:
File Description SizeFormat 
PapadopoulouEudoxiaMsc2018.pdf1.21 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons