Ανάλυση εικόνων σάρωσης με χρήση τεχνικών βαθιάς μάθησης

Πτυχιακή Εργασία 29446 4 Αναγνώσεις

Πρωτότυπος Τίτλος:
Ανάλυση εικόνων σάρωσης με χρήση τεχνικών βαθιάς μάθησης
Συγγραφέας:
Τσάνι, Γιοργκέν, Ρουστέμ
Επιβλέπων καθηγητής:
Παπαδόπουλος, Θ., Γεώργιος
Περίληψη:
Η ανίχνευση παράνομων αντικειμένων είναι ένα κρίσιμο έργο που εκτελείται σε διάφορες τοποθεσίες υψηλής ασφάλειας, όπως αεροδρόμια, σιδηροδρομικούς σταθμούς, μετρό και λιμάνια. Η συνεχής και κουραστική εργασία της εξέτασης χιλιάδων εικόνων ακτίνων Χ ανά ώρα μπορεί να είναι ψυχικά κουραστική. Έτσι, τα Βαθιά Νευρωνικά Δίκτυα (DNN) μπορούν να χρησιμοποιηθούν για την αυτοματοποίηση της διαδικασίας ανάλυσης των εικόνων ακτίνων Χ, τη βελτίωση της αποτελεσματικότητας και την ανακούφιση του φόρτου επιθεώρησης των υπαλλήλων ασφαλείας. Οι νευρωνικές αρχιτεκτονικές που χρησιμοποιούνται συνήθως στη σχετική βιβλιογραφία είναι τα Συνελικτικά Νευρωνικά Δίκτυα (Convolutional Neural Network, CNN), ενώ σπάνια χρησιμοποιούνται οι Μετασχηματιστές Όρασης (Vision Transformers, ViT). Η παρούσα πτυχιακή διεξάγει μια ολοκληρωμένη αξιολόγηση των σχετικών αρχιτεκτονικών ViT για την ανίχνευση παράνομων αντικειμένων σε εικόνες ακτίνων Χ. Η μελέτη αυτή χρησιμοποιεί τόσο Transformers (μετασχηματιστές) όσο και υβριδικά μοντέλα ως backbone, όπως οι SWIN και NextViT, και ανιχνευτές, όπως οι DINO και RT-DETR. Επιπλέον, θα αξιολογηθούν και ενότητες μοντέλων που εφαρμόστηκαν σε CNN backbones, τα οποία έχουν κατασκευαστεί συγκεκριμένα για τον τομέα της ασφάλειας σε εικόνες σάρωσης. Αναλύονται όλες οι μέθοδοι που αξιοποιούνται στη συγκριτική αξιολόγηση, καθώς και τα σχετικά σύνολα δεδομένων. Τα αποτελέσματα καταδεικνύουν την αξιοσημείωτη ακρίβεια του ανιχνευτή Co-DETR Transformer, την εντυπωσιακή απόδοση σε πραγματικό χρόνο του YOLOv8 και την αποτελεσματικότητα της υβριδικής ραχοκοκαλιάς NextViT. Αντίθετα, οι ειδικές μονάδες για εικόνες σάρωσης επέδειξαν τις χειρότερες επιδόσεις από όλες τις μεθόδους που αξιολογήθηκαν, τεκμηριώνοντας έτσι τον ισχυρισμό ότι off-the-shelf μέθοδοι είναι πιο αποτελεσματικές για το συγκεκριμένο έργο.
Ημερομηνία κατάθεσης:
2024-10-15
Γλώσσες Τεκμηρίου:
Ελληνικά
Θεματικές Κατηγορίες:
Ηλεκτρονικοί υπολογιστές. Επιστήμη των υπολογιστών
Λοιπά Θέματα:
Νευρωνικά δίκτυα (Επιστήμη των υπολογιστών)
Λέξεις-κλειδιά:
Ανίχνευση αντικειμένων, Οπτικοί Μετασχηματιστές, Βαθιά Νευρωνικά Δίκτυα, Παράνομα αντικείμενα, Εικόνες Σάρωσης
Περιγραφή:
58 σ.,εικ.,πίν.,σχ.
Άδεια χρήσης:
19429 Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Όχι Παράγωγα Έργα 4.0

GIORGKENTSANI.pdf

4 MB