Επιθέσεις σε μοντέλα μηχανικής μάθησης που διαχειρίζονται κειμενικά δεδομένα

Μεταπτυχιακή Εργασία 24616 198 Αναγνώσεις

Πρωτότυπος Τίτλος:
Επιθέσεις σε μοντέλα μηχανικής μάθησης που διαχειρίζονται κειμενικά δεδομένα
Συγγραφέας:
Αναστασίου, Θεοδώρα, Μάριος
Επιβλέπων καθηγητής:
Καραγιώργου, Σοφία
Περίληψη:
Καθώς οι τεχνολογίες της Μηχανικής Μάθησης και της Τεχνητής Νοημοσύνης αναπτύσσονται και εφαρμόζονται σε νέα συστήματα, αυξάνονται και οι ανησυχίες για την ευαισθησία και την διασφάλιση της απόδοση αυτών των εφαρμογών. Στην παρούσα διπλωματική εργασία, αναφέρονται κίνδυνοι και επιθέσεις που μπορούν να αποδυναμώσουν τα μοντέλα μηχανικής μάθησης όπως και τρόποι αντιμετώπισης ή προφύλαξης των μοντέλων αυτών. Συγκεκριμένα παρουσιάζονται επιθέσεις σε μοντέλα που διαχειρίζονται κείμενα, οι οποίες χωρίζονται σε δύο κύριες κατηγορίες. Η πρώτη κατηγορία αφορά επιθέσεις που επηρεάζουν την οπτική διαφοροποίηση των κειμένων, όπως είναι μία επίθεση σε επίπεδο χαρακτήρα των λέξεων, ενώ η δεύτερη κατηγορία αφορά επιθέσεις που επηρεάζουν την εννοιολογική τους σημασία. ‘Επειτα, παρουσιάζονται οι αντίστοιχοι μηχανισμοί άμυνας της κάθε επίθεσης, για την εξασφάλιση της
προστασίας και της διατήρησης της απόδοσης των μοντέλων μηχανικής μάθησης όσο το δυνατόν περισσότερο. Ακολουθεί η εφαρμογή των τεχνολογιών μηχανικής μάθησης σε δύο διαφορετικά σενάρια, με το πρώτο να αφορά επιθέσεις σε επίπεδο χαρακτήρα, αντικρούωντας τις, με τον αντίστοιχο μηχανισμό άμυνας. Για την ανάδειξη της συγκεκριμένης επίθεσης
χρησιμοποιείται το εργαλείο TextAttack, το οποίο τροποποιεί τα δεδομένα που εισέρχονται στο μοντέλο σαν δεδομένα εκπαίδευσης, ενώ ως μηχανισμός άμυνας χρησιμοποιείται το ScRNN. Στο συγκεκριμένο σενάριο γίνεται χρήση των προ εκπαιδευμένων μοντέλων BERT και DistilBert. Παράλληλα το δεύτερο σενάριο αφορά σε επίπεδο σημασιολογίας. Για την ανάδειξη της συγκεκριμένης επίθεσης χρησιμοποιείται το δίκτυο WordNet το οποίο παρέχει επίσης το εργαλείο TextAttack. Ταυτόχρονα χρησιμοποιείται και η επίθεση IGA, η οποία τροποποιεί τα δεδομένα που εισέρχονται στο μοντέλο ως δεδομένα ελέγχου, ενώ ο αντίστοιχος μηχανισμός άμυνας που επιλέχθηκε είναι ο SEM. Στο συγκεκριμένο σενάριο γίνεται χρήση των μοντέλων CNN και RNN. Ο σκοπός είναι η αξιολόγηση και η σύγκριση των αποδόσεων των μοντέλων μέσω διαφορετικών τεχνικών. Η αξιολόγηση αυτή έγινε σε τρεις διαφορετικές φάσεις : πριν από
την επίθεση, μετά την επίθεση και μετά από την εφαρμογή του μηχανισμού άμυνας. Κατα την εξαγωγή των αποτελεσμάτων πραγματοποιήθηκε ο διαχωρισμός και η παρουσίαση συγκεκριμένων παραδειγμάτων από τα σενάρια αυτά. Συμπληρωματικά γίνεται αναφορά στα συστήματα Question Answering, τα οποία βασίζονται σε παρόμοιες τεχνολογίες. Παράλληλα παρουσιάζεται μια εφαρμογή τους, με την χρήση του Bert-as-a-Service σε συνδυασμό με τις
επιθέσεις σε μοντέλα μηχανικής μάθησης, τόσο σε επίπεδο χαρακτήρα όσο και σε επίπεδο σημασιολογίας. Τέλος αναγράφονται τα συμπεράσματα που προέκυψαν όπως και οι μελλοντικές πιθανές επεκτάσεις.
Ημερομηνία κατάθεσης:
2021-04-05
Γλώσσες Τεκμηρίου:
Ελληνικά
Θεματικές Κατηγορίες:
Ηλεκτρονικοί υπολογιστές. Επιστήμη των υπολογιστών
Λοιπά Θέματα:
Τεχνητή νοημοσύνη
Λέξεις-κλειδιά:
Εργασίες Επεξεργασίας φυσικής γλώσσας, Αντιπαραθετική άμυνα, Αντιπαραθετική επίθεση, Μηχανική Μάθηση, νευρωνικά δίκτυα
Περιγραφή:
70 σ.,εικ.,πίν.,σχ.
Άδεια χρήσης:
19429 Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Όχι Παράγωγα Έργα 4.0

THEODORAANASTASIOU_.pdf

2 MB