Ανάπτυξη προγράμματος εντοπισμού λογοκλοπών σε ελληνικά δοκίμια

Πτυχιακή Εργασία 19074
Πρωτότυπος Τίτλος:
Ανάπτυξη προγράμματος εντοπισμού λογοκλοπών σε ελληνικά δοκίμια
Συγγραφέας:
Μπάγιος, Αλέξανδρος Θ.
Επιβλέπων καθηγητής:
Δημητρακόπουλος, Γεώργιος
Περίληψη:
Συστήματα σχεδιασμένα ώστε η λειτουργία τους να βασίζεται στην αξιοποίηση της
'πλαισιακής' γνώσης είναι αρκετά και συναντώνται σε διαφορετικούς θεματικούς κλάδους. Με
την εκμετάλλευση του τρόπου λειτουργίας αυτής της αρχιτεκτονικής γίνεται να
υλοποιηθούν συστήματα που παρουσιάζουν στοιχεία επαναληπτικότητας κατά την
εκτέλεσή τους. Ένα πεδίο εφαρμογής αυτής της αρχιτεκτονικής είναι ο εντοπισμός
λογοκλοπών. Αναγνωρίζοντας την επαναληπτικότητα στον τρόπο ταύτισης όμοιων φράσεων
μεταξύ πηγών, η εφαρμογή ενός αλγορίθμου αναγνώρισης πλαισίου μπορεί να αποφέρει
θετικά αποτελέσματα ως προς την ποιότητα των αποτελεσμάτων αλλά και
την απόδοση του συστήματος που εκτελεί τη διαδικασία αυτή. Ενώ υπάρχει ένας
αξιόλογος αριθμός ηλεκτρονικών εργαλείων για τον εντοπισμό λογοκλοπών, εφαρμογές για
τον εντοπισμό λογοκλοπών που να απευθύνονται συγκεκριμένα σε ελληνικά δοκίμια σπανίζουν.
Αντικείμενο της πτυχιακής εργασίας είναι η υλοποίηση μίας εφαρμογής ανοιχτού κώδικα για
τον εντοπισμό λογοκλοπών προσαρμοσμένη στην ανάλυση ελληνικών κειμένων με τη χρήση
ενός αλγορίθμου ταύτισης πλαισίου. Προκειμένου να λειτουργήσει αυτό το σύστημα,
θα πρέπει να υλοποιηθούν μέθοδοι εξαγωγής κειμένου, αναζήτησησ
φράσεων στο διαδίκτυο και αποθήκευσησ εγγραφών στη μνήμη του συστήματος. Με μία βασική
υλοποίηση του προγράμματος μπορούμε να καταλήξουμε σε συμπεράσματα τόσο για την
ποιότητα της ανάλυσης στον τομέα των λογοκλοπών, όσο και για την απόδοση του συγκεκριμένου
μοντέλου. Στο σύστημα που αναπτύχθηκε στη γλώσσα Java, υλοποιούνται τεχνικές αναγνώρισης
κειμένου και εξαγωγής κειμένου, όπως επίσης μέθοδοι αναζήτησης φράσεων στο
διαδίκτυο χρησιμοποιώντας τις υπηρεσίες των μηχανών αναζήτησης Google, Bing και Yahoo.
Συμπεριλαμβάνονται επίσης διαδικασίες για την εξαγωγή κειμένου από διαδικτυακές σελίδες
καθώς και τη διατήρηση και ενημέρωση ενός εσωτερικού αποθετηρίου της μορφής μίας
σχεσιακής βάσης δεδομένων.
Ημερομηνία κατάθεσης:
2017-07-10
Γλώσσες Τεκμηρίου:
Ελληνικά
Θεματικές Κατηγορίες:
Ηλεκτρονικοί υπολογιστές. Επιστήμη των υπολογιστών
Λοιπά Θέματα:
Λογισμικό εφαρμογών - Ανάπτυξη
Λογισμικό ανοιχτού κώδικα
Λέξεις-κλειδιά:
Πλαίσιο, αναγνώριση πλαισίου, λογοκλοπές, μηχανές αναζήτησης, web scraping
Περιγραφή:
66 σ.:εικ.
Άδεια χρήσης:
19429 Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Όχι Παράγωγα Έργα 4.0

BAGIOS_IT_17.pdf

777 KB