Περίληψη:
Τα CNNs έχουν επιτύχει εντυπωσιακά αποτελέσματα σε διάφορες εφαρμογές υπολογιστικής όρασης, όπως ταξινόμηση εικόνων, ανίχνευση αντικειμένων και ιατρική απεικόνιση. Ωστόσο, η ανάπτυξη αυτών των μοντέλων σε συσκευές άκρου με περιορισμένους πόρους παραμένει πρόκληση λόγω των υψηλών υπολογιστικών απαιτήσεων. Παραδοσιακές τεχνικές συμπίεσης μοντέλων, όπως το pruning, η ποσοτικοποίηση και η μεταφορά γνώσης, μειώνουν την πολυπλοκότητα του μοντέλου, αλλά συχνά απαιτούν πρόσβαση στο αρχικό σύνολο δεδομένων εκπαίδευσης και περιλαμβάνουν επανεκπαίδευση για την ανάκτηση της ακρίβειας που έχει μειωθεί. Σε πολλές περιπτώσεις, η πρόσβαση στο αρχικό σύνολο δεδομένων μπορεί να είναι περιορισμένη λόγω απορρήτου, περιορισμών ιδιοκτησίας ή έλλειψης αποθηκευτικού χώρου. Στην παρούσα εργασία, διερευνούμε μεθόδους pruning φίλτρων ανεξάρτητες από το σύνολο δεδομένων, που βελτιστοποιούν τα CNNs χωρίς να απαιτούν επανεκπαίδευση ή πρόσβαση στο αρχικό σύνολο δεδομένων. Αξιολογούμε συστηματικά διαφορετικές τεχνικές pruning, εφαρμόζοντας αυτές τις τεχνικές σε ένα προεκπαιδευμένο μοντέλο VGG16 και στο CIFAR-10 dataset. Αναλύουμε την επίδρασή τους στην ακρίβεια του μοντέλου, την υπολογιστική απόδοση και το αποτύπωμα στη μνήμη. Παρέχοντας μια ολοκληρωμένη σύγκριση στρατηγικών pruning, προσφέρουμε πρακτικές γνώσεις για την ανάπτυξη μοντέλων βαθιάς μάθησης σε περιβάλλοντα με περιορισμένους πόρους. Τα ευρήματά μας αναδεικνύουν τη δυναμική των τεχνικών pruning ανεξάρτητων από το σύνολο δεδομένων στη βελτίωση της αποδοτικότητας των μοντέλων, τη μείωση του χρόνου εκτέλεσης και την υποστήριξη εφαρμογών Τεχνητής Νοημοσύνης (AI) σε τομείς όπου η ιδιωτικότητα και ο χρόνος απόκρισης είναι κρίσιμοι, όπως mobile computing, τα αυτόνομα συστήματα και το embedded AI.
Λέξεις-κλειδιά:
χωρίς επανεκπαίδευση, σύμπτυξη, Συνελικτικά νευρωνικά δίκτυα, περικοπή φίλτρων