Εξόρυξη γνώσης από βιβλιογραφικά δεδομένα

Πτυχιακή Εργασία 16596
Πρωτότυπος Τίτλος:
Εξόρυξη γνώσης από βιβλιογραφικά δεδομένα
Συγγραφέας:
Παναγόπουλος, Γεώργιος
Περίληψη:
Τα βιβλιογραφικά δεδομένα είναι ζωτικής σημασίας για την ακαδημαϊκή κοινωνία που αποτελείται από ζωτική ύλη για μελετητές και ερευνητές. Με τα χρόνια, διάφορες προσπάθειες έχουν γίνει, προκειμένου να εκμεταλλευτούν αυτή την πηγή των πληροφοριών με τον καλύτερο δυνατό τρόπο, αποκαλύπτοντας πολλές επιστημονικές καινοτομίες κατά τη διάρκεια αυτής της διαδικασίας, οι οποίες αργότερα εφαρμόστηκαν για άλλους σκοπούς. Από την άλλη πλευρά, έχει υπηρετήσει ως ένα ευημερών πεδίο πειραματισμών σχετικά με διάφορες μεθοδολογίες στον τομέα της πληροφορικής, κυρίως λόγω της πολυμορφίας του. Ως αποτέλεσμα τα βιβλιογραφικά δεδομένα είναι μια ιδανική πάγκο δοκιμών για τον συνδυασμό διαφόρων δεδομένων εξόρυξη μεθοδολογίες και εξόρυξη γνώσης.
Ο στόχος αυτής της εργασίας είναι να εισαγάγει μια νέα προσέγγιση στο πρόβλημα του χαρακτηρισμού της επιτυχίας των συγγραφέων, όχι μόνο με βάση τις δημοσίευσες τους , αλλά και με τις επιπτώσεις της συνεργασίας τους με άλλους συγγραφείς και την εξέλιξη των παραπάνω στο χρόνο. Ως απόδειξη της έννοιας της εργασίας μας, έχουμε επεξεργαστεί τις δημοσιεύσεις όλων των συγγραφέων που συνδέονται με ελληνικά πανεπιστήμια όπως δόθηκε από την ψηφιακή βιβλιοθήκη Scopus.
Πιο συγκεκριμένα, για κάθε συγγραφέα, συλλέγουμε πληροφορίες σχετικά με τον αριθμό των δημοσιεύσεων και τις παραπομπές σε ετήσια βάση. Εκτός από αυτό, έχουμε κατασκευάσει δύο τύπους γράφων συνεργασίας, όπου κάθε συγγραφέας είναι συνδεδεμένο με τον/την συν-συγγραφείς με ακμές που υποδεικνύουν είτε τη δύναμη ή την επίδραση της συνεργασίας. Οι γράφοι έχουν κατασκευαστεί σε ετήσια βάση, καθώς και τα βάρη των ακμών να είναι αθροιστικά με σκοπό τη συγκέντρωση των πληροφοριών από τα προηγούμενα χρόνια. Τέλος, εφαρμόζουμε πολλές τεχνικές εξόρυξης γράφων από την βιολογία και την ανάλυση κοινωνικών δικτύων ώστε να ορίσουμε την κοινωνικότητα των συγγραφέων στους προαναφερθείς γράφους. Έπειτα χρησιμοποιούμε αυτά τα χαρακτηριστικά για να δημιουργήσουμε δείκτες αλλαγών για να συλλάβουμε την εξέλιξη των χαρακτηριστικών συγγραφέων στο χρόνο.
Σε επόμενη φάση, ομαδοποιούμε τους συγγραφείς με παρόμοιο αριθμό δημοσιεύσεων, αναφορών και προφίλ συνεργασιών χρησιμοποιώντας τον k-means αλγόριθμο ομαδοποίησης και μια λίστα από γνωστές μετρικές για αξιολόγηση ομαδοποίησης ώστε να καθορίσουμε τον καλύτερο αριθμό των ομάδων. Έπειτα δημιουργούνται επιγραφές για κάθε ομάδα με βάση τα πιο εξέχων χαρακτηριστικά τους.
Για να ανακαλύψουμε τα πιο σημαντικά σε πληροφορία χαρακτηριστικά χρησιμοποιούμε στατιστικές μεθόδους. Τέλος κάνουμε μια ομαδοποίηση με βάση χρονολογικές σειρές χρησιμοποιώντας dynamic time warping για να ομαδοποιήσουμε τους συγγραφείς με βάση το χρονολόγιο και συγκρίνουμε τα αποτελέσματα με αυτά της κανονικής ομαδοποίησης.
Ημερομηνία κατάθεσης:
2014-06
Γλώσσες Τεκμηρίου:
Ελληνικά
Θεματικές Κατηγορίες:
Ηλεκτρονικοί υπολογιστές. Επιστήμη των υπολογιστών
Λέξεις-κλειδιά:
εξόρυξη δεδομένων, συσταδοποίηση, χρονικά μεταβαλλόμενοι γράφοι,βιβλιογραφικά δεδομένα
Περιγραφή:
103 σ.:εικ.
Άδεια χρήσης:
19429 Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Όχι Παράγωγα Έργα 4.0

thesis_Panagopoulos.pdf

2 MB