Ανάπτυξη συστήματος που θα διαχωρίζει αληθείς από ψευδείς ειδήσεις αξιοποιώντας πολλαπλές πηγές

Πτυχιακή Εργασία 20411
Πρωτότυπος Τίτλος:
Ανάπτυξη συστήματος που θα διαχωρίζει αληθείς από ψευδείς ειδήσεις αξιοποιώντας πολλαπλές πηγές
Συγγραφέας:
Μπασούκου, Στεφανία Σ.
Επιβλέπων καθηγητής:
Βαρλάμης, Ηρακλής
Περίληψη:
Στις μέρες μας, υπάρχει μια μεγάλη και συνεχόμενη αναπαραγωγή πληροφοριών, λόγω τις εύκολης δημοσίευσης απόψεων και ειδήσεων στο διαδίκτυο. Με αυτόν τον τρόπο ο αναγνώστης δυσκολεύεται και οδηγείται σε λάθος συμπεράσματα με βάση το άρθρο που διαβάζει. Η συγκεκριμένη εργασία πραγματεύεται την κατηγοριοποίηση των ειδήσεων σε αληθείς ή ψευδείς. Έχει ως στόχο να προσδιορίσει τα γνωρίσματα που ενδέχεται να ξεχωρίζουν μια πραγματική από μια πλαστή είδηση και στη συνέχεια να φτιάξει ένα μοντέλο που θα διαχωρίζει τις ειδήσεις. Αρχικά, συγκεντρώθηκαν έρευνες που είχαν ως θέμα την ανίχνευση ψευδών ειδήσεων, στις οποίες παρατηρήθηκαν τα χαρακτηριστικά και οι τεχνικές που χρησιμοποιούν. Οι έρευνες χωρίζονται σε τρεις κατηγορίες, αυτές που υποστηρίζουν την εγκυρότητα ενός κειμένου με βάση τις πηγές του, αυτές που βασίζονται στο κείμενο, και εκείνες που συνδυάζουν και τις δύο τεχνικές. Τα συμπεράσματα ήταν ότι η έρευνα πρέπει να βασιστεί στο κείμενο και τις πηγές ενός άρθρου. Όσον αφορά την υλοποίηση, συγκεντρώθηκαν, με αυτόματο τρόπο, χαρακτηριστικά για 100 αληθινά και 100 ψευδή άρθρα. Το σύνολο των δεδομένων αποθηκεύτηκε σε ένα αρχείο csv , ώστε να επεξεργαστεί για να βγουν τα απαραίτητα συμπεράσματα. Μέσω του εργαλείου knime, έγινε η προ-επεξεργασία των δεδομένων και η κατηγοριοποίηση αυτών. Για τους διάφορους αλγορίθμους, πήραμε το ποσοστό της ακρίβειας που πέτυχαν. Έπειτα, υπάρχει σύγκριση των αλγορίθμων και οι δύο αλγόριθμοι που είχαν την μεγαλύτερη ακρίβεια, σε αυτό το σύνολο δεδομένων, ήταν ο Decision Tree και ο Gradient Boosted Trees με ποσοστό 69,667%. Τέλος, αναλύονται οι προτάσεις για βελτίωση της απόδοσης του μοντέλου που χρησιμοποιήθηκε, οι οποίες αφορούν τους classifiers και το dataset.
Ημερομηνία κατάθεσης:
2018-07-06
Γλώσσες Τεκμηρίου:
Ελληνικά
Θεματικές Κατηγορίες:
Ηλεκτρονικοί υπολογιστές. Επιστήμη των υπολογιστών
Λοιπά Θέματα:
Πληροφόρηση - Τεχνολογία
Λέξεις-κλειδιά:
αληθείς,ψευδείς,ψευδείς,άρθρο,κατηγοριοποίηση
Περιγραφή:
78 σ.,εικ.,πίν.,σχ.
Άδεια χρήσης:
19429 Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Όχι Παράγωγα Έργα 4.0

StefaniaBasoukou.pdf

496 KB