Μηχανική μάθηση για την αναγνώριση και πρόβλεψη χειρόγραφου κειμένου

Πτυχιακή Εργασία 23483 69 Αναγνώσεις

Πρωτότυπος Τίτλος:
Μηχανική μάθηση για την αναγνώριση και πρόβλεψη χειρόγραφου κειμένου
Συγγραφέας:
Μπομπάϊ, Στέλιο, Λάζι
Επιβλέπων καθηγητής:
Καραγιώργου, Σοφία
Περίληψη:
Σήμερα, η ακριβής αναγνώριση των εκτυπωμένων χαρακτήρων θεωρείται ως
επιλυμένο πρόβλημα. Πολλά εμπορικά προϊόντα επικεντρώνονται προς αυτήν την κατεύθυνση, επιτυγχάνοντας υψηλά ποσοστά αναγνώρισης. Ωστόσο, η αναγνώριση χειρόγραφου χαρακτήρα είναι συγκριτικά δυσκολότερη. Έτσι, η αναγνώριση χειρόγραφων εγγράφων εξακολουθεί να αποτελεί αντικείμενο ενεργού έρευνας.
Επιπλέον, η πρόβλεψη λέξης ή τα γλωσσικά μοντέλα είναι η εργασία της
πρόβλεψης των πιο πιθανών λέξεων με βάση τις προηγούμενες λέξεις. Έχει πολλές εφαρμογές, όπως η πρόταση της επόμενης λέξης κατά την εισαγωγή κειμένου, ως βοήθημα στην επίλυση της ασάφειας στην αναγνώριση ομιλίας και γραφής και στη μηχανική μετάφραση.
Αυτή η εργασία στοχεύει στην ανάπτυξη μιας αλληλουχίας ως εξής: προ
επεξεργασία μιας εικόνας εισόδου, ανίχνευση κειμένου, τμηματοποίηση γραμμής, τμηματοποίηση χαρακτήρων, αναγνώριση χαρακτήρων και τέλος πρόβλεψη λέξεων. Τα δύο κύρια στάδια αυτού του αγωγού είναι το στάδιο αναγνώρισης και το στάδιο πρόβλεψης. Στο στάδιο αναγνώρισης το Computer Vision μαζί με το CNN, που αναπτύχθηκε με την Keras βιβλιοθήκη, χρησιμοποιήθηκαν για την προ-επεξεργασία και την αναγνώριση κειμένου από την εικόνα εισόδου, ενώ στο στάδιο της πρόβλεψης υπάρχουν δύο βασικές μεθοδολογίες, το Markov μοντέλο και το LSTM, που χρησιμοποιούνται για την πρόβλεψη κειμένου με βάση το αποτέλεσμα του προηγούμενου σταδίου.
Συνοψίζοντας, επιτεύχθηκε ακρίβεια 99,834% σε 120 λεπτά για το μοντέλο
CNN και με την κατάλληλη προ-επεξεργασία στην εικόνα εισόδου μπορεί να
υπάρξει ακριβής αναγνώριση των χαρακτήρων της εικόνας. Επιπλέον, αν και, τα
αποτελέσματα από το μοντέλο Markov έχουν νόημα στην αγγλική γλώσσα και είναι πολύ γρήγορα να ληφθούν (λίγα δευτερόλεπτα), δεν είναι πολύ λογικά. Αντιθέτως, τα αποτελέσματα από το μοντέλο LSTM, το οποίο πέτυχε ακρίβεια 14.751% σε 150 λεπτά, είναι πιο συντακτικά και γραμματικά σωστά και θα μπορούσαν να είναι ένα πραγματικό κείμενο.
Ημερομηνία κατάθεσης:
2020-07-27
Γλώσσες Τεκμηρίου:
Ελληνικά
Θεματικές Κατηγορίες:
Ηλεκτρονικοί υπολογιστές. Επιστήμη των υπολογιστών
Λοιπά Θέματα:
Εφαρμογές, εργαλεία, κλπ.
Λέξεις-κλειδιά:
νευρωνικά δίκτυα, Μηχανική Μάθηση, επεξεργασία φυσικής γλώσσας, αναγνώριση εικόνας
Περιγραφή:
99 σ.:εικ.,πίν.
Άδεια χρήσης:
19429 Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Όχι Παράγωγα Έργα 4.0

SteliosBompai.pdf

3 MB