Πρωτότυπος Τίτλος:
Ανακάλυψη τύπου προσωπικότητας μέσα από δεδομένα των κοινωνικών δικτύων
Συγγραφέας:
Κουλτσόπουλος, Λάζαρος, Δημήτριος
Επιβλέπων καθηγητής:
Βαρλάμης, Ηρακλής
Περίληψη:
Η αυτόματη εξαγωγή συμπερασμάτων, για την ψυχική κατάσταση ενός ανθρώπου, είναι ένας από τους πιο δημοφιλείς και συναρπαστικούς τομείς της τεχνητής νοημοσύνης και της επιστήμης των δεδομένων. Εξαιρετικής σημασίας είναι η γνώση της προσωπικότητας στην λήψη διαφόρων σημαντικών αποφάσεων, όπως για παράδειγμα, ο επαγγελματικός προσανατολισμός αλλά και η υγεία. Για την περιγραφή της προσωπικότητας ενός ατόμου, έρευνες πολλών ετών έχουν καταφέρει να καταλήξουν σε σπουδαία συμπεράσματα. Μέσα από τα συμπεράσματα αυτά, δημιουργήθηκαν διάφορα μοντέλα-εργαλεία ανακάλυψης προσωπικότητας, με τα δημοφιλέστερα να είναι το Big Five και το MBTI. Τα εργαλεία της μηχανικής μάθησης, μπορούν να προσφέρουν πολλές νέες πληροφορίες στο χώρο αυτό. Προϋπόθεση είναι η ύπαρξη πληθώρας και ποικιλίας δεδομένων. Δυστυχώς συχνό εμπόδιο είναι η προστασία των προσωπικών δεδομένων, αν και όχι άδικα. Το πιο απτό και προσβάσιμο μέσο για την κατηγοριοποίηση της προσωπικότητας ενός ατόμου είναι το κείμενο. Τα προηγούμενα χρόνια, αντίστοιχες προκλήσεις αντιμετωπίζονταν με απλά μοντέλα μηχανικής μάθησης τα οποία δεν είχαν ικανοποιητική απόδοση. Όμως τα τελευταία χρόνια έχει γίνει μεγάλη πρόοδος από μοντέλα που βασίζονται σε νευρωνικά δίκτυα όπως οι Μετασχηματιστές (Transformers). Στη παρούσα εργασία, εμφανίζεται ένα σύνολο τεχνικών, για την κατηγοριοποίηση της προσωπικότητας του εκάστοτε χρήστη, αξιοποιώντας τα κοινοποιημένα κείμενά του, σε μέσα κοινωνικής δικτύωσης σύμφωνα με το σύστημα Myers-Briggs Type Indicator (MBTI). Παρακάτω, παρουσιάζονται δύο μοντέλα, το πρώτο χρησιμοποιώντας το εργαλείο LDA και το δεύτερο τελειοποιώντας (fine-tuning) το προ-εκπαιδευμένο μοντέλο BERT (Bidirectional Encoder Representations from Transformers). Στην πρώτη περίπτωση ο τελικός εκτιμητής είναι ένα μοντέλο Support Vector Machine (SVM), ενώ στην δεύτερη ένα επίπεδο με νευρώνες Perceptron.
Ημερομηνία κατάθεσης:
2022-07-25
Γλώσσες Τεκμηρίου:
Ελληνικά
Θεματικές Κατηγορίες:
Ηλεκτρονικοί υπολογιστές. Επιστήμη των υπολογιστών
Λοιπά Θέματα:
Κοινωνικά δίκτυα
Λέξεις-κλειδιά:
Δείκτης Τύπου Προσωπικότητας Μάιερς Μπριγκς, Κατηγοριοποίηση κειμένου, Επεξεργασία Φυσικής Γλώσσας, Μηχανική Μάθηση, Εξόρυξη Δεδομένων
Περιγραφή:
51 σ.,εικ.,πίν.,διαγρ.,σχ.
Άδεια χρήσης:

Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Όχι Παράγωγα Έργα 4.0